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Módulo 4 
Análisis 
de la información 


El análisis de la información en el proceso investigativo, depende del 
enfoque y del tipo de investigación que se haya seleccionado, como tam- 
bién de los objetivos que se hayan planteado. 


La estadística se constituye en una herramienta fundamental para el 
análisis de la información. Sin embargo es necesario precisar y seleccio- 
nar el tratamiento estadístico dependiendo del enfoque cuantitativo o cua- 
litativo, de la escala de medición de las variables, de las hipótesis y de los 
objetivos. 


La estadística es fundamental para resolver problemas de descripción 
de datos, análisis de muestras, contrastación de hipótesis, medición de 
relaciones y predicciones. 


1. NATURALEZA DE LA ESTADÍSTICA 
La estadística es una rama de la ciencia, encargada del diseño y apli- 
cación de métodos para recolectar, organizar, analizar y hacer deduccio- 


nes a partir de ellos. 


Aunque los orígenes de la estadística se remontan a los estudios de 
los juegos de azar del siglo XVIII, sólo en los últimos 60 años se han desa- 


26 SERIE: APRENDER A INVESTIGAR 


rrollado las aplicaciones de los métodos estadísticos en casi todos los 
campos de la ciencia (social, comportamental y física). La mayor parte de 
las primeras aplicaciones de la estadística consistieron principalmente en 
la presentación de datos en forma de tablas y gráficas. Este campo se 
desarrolló con rapidez llegando a incluir gran variedad de métodos para 
ordenar, resumir y expresar en alguna forma las características de un con- 
junto de números. Hoy estas técnicas cubren lo que es sin duda la más 
visible aplicación de la estadística: la masa de información cuantitativa 
que se recopila y se publica todos los días en nuestra sociedad. Las tasas 
de natalidad, de mortalidad, los índices de precios, los promedios de go- 
les obtenidos en las fechas semanales de fútbol, son algunas de las mu- 
chas «estadísticas» que nos resultan familiares. 


Además de expresar las características de la información cuantifica- 
ba, estas medidas proporcionan una base importante para el análisis en 
casi todas las disciplinas académicas, especialmente en las ciencias so- 
ciales y del comportamiento, donde la conducta humana no puede gene- 
ralmente ser descrita con la precisión que se consigue en las ciencias 
exactas. Las medidas estadísticas de satisfacción, inteligencia, aptitud 
para el trabajo y capacidad de liderazgo, que sirven para ampliar nuestro 
conocimiento de las motivaciones y del rendimiento humano, son ejem- 
plos de lo dicho. Del mismo modo, los índices de precios, productividad, 
producto nacional bruto, empleo, reservas disponibles y exportaciones son 
elementos útiles tanto para el gerente como para el gobernante cuando se 
trata de trazar una política encaminada a lograr el desarrollo y la estabili- 
dad económica a largo plazo. 


La estadística proporciona una metodología para evaluar y juzgar las 
discrepancias entre la realidad y la teoría. Además de su papel instrumen- 
tal, el estudio de la estadística es importante para entender las posibilida- 
des y limitaciones de la investigación experimental, para diferenciar las 
conclusiones que pueden obtenerse de los datos de aquellas que carecen 
de base empírica y en definitiva para desarrollar un pensamiento crítico y 
antidogmático ante la realidad. 


En la actualidad con la ayuda de la informática y la tecnología el trata- 
miento estadístico de la información se hace más sencillo. 


Para el análisis de datos cuantitativos, tenemos en la actualidad progra- 
mas como el SAS, SPSS, MINITAB, SVSTAT, RESAMPLING, STATGRA- 
PHIS. Para el análisis de datos cualitativos existen programas como el 
QUALPRO, ETHNOGRAPH, NUDIST, AQUAD. 
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2. DIVISIÓN DE LA ESTADÍSTICA 


La estadística se divide en dos grandes ramas, dependiendo del méto- 
do empleado para manejar la información y hacer que tenga sentido: esta- 
dística descriptiva y estadística inferencial. 


Población 


Estadística inferencial 
Estadística 
descriptiva 


Gráfica 1. 


2.1 Estadística descriptiva. Permite describir resumir y analizar la 
información obtenida de la muestra. 


Para tal fin se recolecta la información, se tabula, se grafica y en mu- 
chos casos en vez de trabajar con todas las observaciones, es preferible 
tener unas medidas que resuman los datos. 


Básicamente hay tres tipos de medidas de resumen: medidas de ten- 
dencia central, medidas de dispersión o variabilidad de los datos y medi- 
das de ubicación. 


La gráfica 1 se interpreta así: con los datos de la muestra se aplica la 
estadística descriptiva; con los resultados de la estadística descriptiva se 
hacen análisis de estadística inferencial referidos a la población. 
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MAPA CONCEPTUAL DE ESTADÍSTICA DESCRIPTIVA 


TABLAS DE FRECUENCIAS 
TABULACIÓN a 
TABLAS DE CONTINGENCIA 


PUNTOS 
GRÁFICAS O LINEAS 
DIAGRAMAS BARRAS HA HISTOGRAMAS 
CÍRCULO 
CAJA 
MEDIA 
MEDIDAS DE MEDIANA 
TENDENCIA MODA 
CENTRAL MEDIA GEOMÉTRICA 
RANGO 
MEDIDAS MEDIDAS DE DESVIACIÓN ESTÁNDAR 
DE DISPERSIÓN VARIANZA 
RESUMEN ÍNDICE DE DISPERSIÓN 
CATEGÓRICO 
CUARTILES 
MEDIDAS DE QUINTILES 
UBICACIÓN DECILES 


PERCENTILES 
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2.1.1 Descripción de datos, técnicas de representación gráfica 


El concepto de la descripción está asociada a la distribución de fre- 
cuencias, que consiste en el ordenamiento o clasificación de los valores 
observados en una variable, de acuerdo con su magnitud numérica. Per- 
mite al investigador identificar la forma como ciertos puntos o caracterís- 
ticas están distribuidos. 


La distribución de frecuencia se puede construir a partir de variables 
medidas a cualquier nivel, desde nominal hasta de razón. 


Podríamos suponer que queremos ver cuántos productores agrícolas 
en una vereda son grandes, medianos o pequeños productores. 


Entrevistamos a los productores de la vereda y les preguntamos la 
extensión de su explotación y la clasificamos de acuerdo con el tamaño 
(magnitud) en una de las tres categorías. 


Se construye la distribución de frecuencias que muestre cuántos pro- 
ductores son grandes, cuántos medianos y cuántos pequeños. El recuen- 
to será: 


Tabla 1 - Tipo de productor agrícola 


Pequeño an 


Mediano dad 
Grande NO 


En el cuadro sólo se ha agrupado el número de agricultores pertene- 
cientes a cada categoría. El número de agricultores se denomina obser- 
vaciones o frecuencia (f). 


Para el caso de variables medidas a nivel intervalo o de razón, pode- 
mos hacer exactamente el mismo ejercicio. 


Si se tiene, por ejemplo, la información acerca del número de cajas de 
madera que construyen al día unos carpinteros en un taller, podríamos 
clasificarlos por su productividad. 
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Tabla 2 - Número de cajas construidas por 15 carpinteros 


N?* de cajas 
Carpinteros construidas 


4 
2 
3 
4 
5 
6 
7 
8 
9 


A partir de esta información podemos aclarar aún más la naturaleza de 
la producción por carpintero y se podría entrar a comparar esta productivi- 
dad con la de otro tipo de taller o fábrica. 


En la tabla 3 introducimos un mayor significado y ordenamiento a la 
información que se está analizando. 


Tabla 3 - Número de cajas construidas por 15 carpinteros 


N? de carpinteros 
N? de cajas que construyen X 
construidas N? de cajas 


Hasta ahora los ordenamientos que se han hecho son bastante simples, 
pero en la vida real muchas veces la información analizada es más compleja 
y la distribución de frecuencias debe ser construida a partir de un mayor 
número de puntajes. 
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2.1.2 Distribuciones de frecuencias 


La distribución de frecuencias es un método para organizar y resumir 
datos. Bajo este método los datos que componen una serie, se clasifican 
y ordenan, indicándose el número de veces en que se repite cada valor. 


Los caracteres de los elementos de una población pueden ser: cualita- 
tivos y cuantitativos. 


Los datos cualitativos, denominados también atributos, son todos aque- 
llos fenómenos que pueden ser descritos cualitativamente, es decir me- 
diante palabras; son ejemplos de atributos: la clasificación de los alum- 
nos de una universidad por departamento de origen, clasificación de un 
grupo de personas por ocupación, por sexo, por cargo, etc. 


Los caracteres cuantitativos, denominados variables, son todos aque- 
llos fenómenos susceptibles de ser expresados cuantitativamente, es decir 
mediante números. Por ejemplo: peso, estatura, edad, número de hijos, 
salarios, etc. 


Las variables se dividen en: discretas y continuas, teniendo en cuenta 
que ésta clasificación tiene más valor teórico que práctico. 


Las variables discretas son aquellas que admiten solamente valores 
enteros, es decir no tienen valores intermedios; por ejemplo el número de 
hijos por familia, ya que no se puede decir que una familia tiene dos hijos 
y medio. 


Las variables continuas, son aquellas que admiten valores fraccionar- 
los, pudiéndose establecer intervalos. Por ejemplo, la estatura de una per- 
sona que mide un metro con setenta centímetros, que pesa sesenta kilos, 
una libra y cuatro onzas, etc. 


2.1.3 Elaboración de una tabla de frecuencias 


Tomemos como ejemplo una muestra de 20 alumnos, determinando 
su peso en kilos; para facilitar el trabajo redondeamos las cifras. 


Xi =74 X¿=69  X=47  Xp=65  X,=76 
Xo.=67 X¿= 61 Xi =85 Xi4 = 88 Xig = 57 
Xz = 94 X> = 71 Xi: = 82 Xi5 = 52 Xio = 72 


X= 70 X= 78 Xi=55  Xw=58  X2=66 
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El primer paso a seguir consiste en determinar el valor máximo y el 
mínimo. 


En el ejemplo tenemos: 
Adi = 94; Xeniimo = 47 


La diferencia entre el valor máximo y el mínimo se denomina recorrido 
o rango. 


94 - 47 =47 

El rango, será entonces de 47. 

Introducimos dos nuevos símbolos que son: 

m = número de intervalos (o clase de la distribución) 
C = amplitud de intervalo (o de clase de la distribución) 


El valor de m, o sea, el número de intervalos se puede obtener me- 
diante la siguiente fórmula: 


m=1+3.3logn, donde n es el número de datos 


Es de anotar que la anterior fórmula es poco conocida, por consiguien- 
te, es poco usual. Sin embargo, se recomienda que el número de interva- 
los, hasta donde sea posible, no sea menor de 5 ni mayor de 16. 


Para el cálculo de amplitud del intervalo se puede aplicar la siguiente 
fórmula: 


max. min. 


(= ——= C= 
m m 


X -X Osea rango 


Enel caso de nuestro ejemplo, el número de intervalos será: 
m= 1 +3.3 log20 de donde m = 1 + 3.3,x 1,30 
m=1+4,29 


m =5.29=5 intervalos. 
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La amplitud del intervalo de clase será: 
Rango R =47 


Número de intervalos m = 5 


R 


C= ——— de donde C=—= 9.4 
m 


5 


Redondeando y para mejor manejo de los datos, se puede considerar 
que la amplitud del intervalo sea de 9. 


La tabla de frecuencias nos quedará en la siguiente forma, 


Tabla 4 - Distribución de frecuencias del peso de 20 alumnos 


| Peso Frecuencias (f) Frecuencia Relativa Fr 


Frecuencia relativa (Fr) 


Es su frecuencia dividida por el total de datos y se expresa general- 
mente como un porcentaje: 


Fr = — 
n 


2.1.4 Presentación gráfica 


Aunque las tablas sean ya el resultado de una concentración de datos, 
pueden ser, sin embargo, demasiado amplias y complejas, de modo que 
pierden una buena parte de lo que debería ser su cualidad primordial, la 
claridad. 


Entonces, podemos recurrir a la presentación gráfica, para la mejor 
comprensión y análisis de los datos. En las variables discretas se hace la 
representación mediante diagramas de frecuencias; para ello, en el eje hori- 
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zontal, se colocan los distintos valores de las frecuencias absolutas o rela- 
tivas. Si la representación se refiere a las frecuencias absolutas o relativas 
acumuladas se denomina: Diagrama de frecuencias acumuladas, colocán- 
dose los valores de la variable en el eje horizontal y las frecuencias Fr, en el 
vertical. 


2.1.4.1 Histogramas y polígonos de frecuencias 

Una distribución de frecuencias, se puede describir por medio de histo- 
gramas de frecuencias, que son gráficos que representan la información 
contenida en una distribución de frecuencias. 

El ejemplo de la tabla 4, sobre el peso de los alumnos, se puede pre- 


sentar en un histograma que representa exactamente lo mismo. 


Gráfica 1. 
Peso en kilos de 20 alumnos de un colegio 


n 
= 
o 
2 
Lu 
> 
O 
uy 
3 
u 


Otra manera de describir la distribución de la información obtenida, es 
por medio del polígono de frecuencias. 


Estos son gráficos en la forma de una serie de líneas rectas conecta- 
das entre sí y que unen puntos medios de intervalos a lo largo del eje 
horizontal. 


El caso del peso de los alumnos, puede servirnos para ilustrar la técnica 
de los polígonos de frecuencia. Para construirlo se siguen los mismos pa- 
sos que para construir un histograma, pero en lugar de construir los rectán- 
gulos a partir de los límites superior e inferior de los intervalos, se calcula el 
punto medio del mismo y se unen, por medio de una línea recta que se 
conecta a los puntos medios de los demás intervalos. 
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Así por ejemplo en el gráfico 1 podemos trazar el polígono de frecuen- 
cias, uniendo los puntos medios del histograma de frecuencias. 


2.1.4.2 Gráficas de barras 


La gráfica de barras es fácil de construir y su interpretación es de 
gran utilidad. Una gráfica diseñada para mostrar magnitudes absolu- 
tas deberá tener su inicio en cero y una escala de cantidades conti- 
nuas. Las gráficas de barras pueden construirse en forma vertical u 
horizontal. 


Las gráficas de barras pueden dividirse en tres tipos: 

a. Gráficas de barras con partes componentes. En esta gráfica cada ba- 
rra ha sido segmentada en dos partes componentes; así, por ejemplo, 
en la siguiente gráfica se tiene que la población de estudiantes de 100 


semestre de la facultad X, de la Universidad Y, se distribuye según el 
sexo y la edad así: 


Distribución de los estudiantes de décimo semestre de la Facultad X, 
de la Universidad Y, por sexo y edad 


15-19 
20-24 
25-29 Ohombres 
Mm ujeres 
30-34 
0 10 20 30 40 


Número de Estudiantes 


Edad 


En la gráfica se muestra el número de estudiantes clasificados por 
sexo y edades, en cada barra se presentan los dos componentes, los 
hombres y las mujeres. 


b. Gráficas de barras agrupadas. En esta gráfica, se presentan los mis- 
mos datos de estudiantes, excepto que los componentes por sexo se 
muestran separadamente así: 
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Distribución de los estudiantes de décimo semestre de la Facultad X, 
de la Universidad Y, según el sexo y la edad 


20-24 


Edad 


Mn ujeres 
Bhombres 


25-29 


0 5 10 15 20 25 30 


Número de Estudiantes 


c. Gráficas de barras bidireccionales. Cuando se desea graficar cantida- 
des positivas y negativas, tales como pérdidas y ganancias en la pro- 
ducción de una empresa, por tipo de producto. Así, en la gráfica de 
producción de la empresa X, se tiene que las pérdidas y ganancias por 
tipo de producto son: 


Utilidad o pérdida en la producción de la Empresa X 


h 
Secadores [27] 
Enfriadores == 
panchos == 


Dutilidad o 


pérdida 


Producción 


2.1.4.3 Gráficas lineales 


Cuando debe presentarse una serie que cubre un gran número de pe- 
ríodos de tiempo, los datos graficados por medio de barras se ven dema- 
siado acumulados; entonces, éstas pueden ser reemplazadas por una 
línea, ya que las líneas son más efectivas que las barras, cuando existen 
marcadas fluctuaciones en las series, o cuando deben presentarse varias 
series sobre la misma gráfica. Por ejemplo, el número de estudiantes de 
la facultad X, matriculados por sexo, en el período 1990-1998. 
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Número de estudiantes de la Facultad X, matriculados por sexo, 
en el período 1990-1998 


600 
500 —— Hombres 


EF Vujeres 


—4— Total 


100 7 


Número de Estudiante 
mw 
oo 
oo 


2.1.4.4 Gráficas circulares 


Las gráficas circulares, llamadas también de tipo pastel, se usan para 
mostrar los tamaños relativos de los componentes de un total. Son utiliza- 
dos, para indicar cosas tales como participación de cada facultad en el 
total de estudiantes matriculados de determinada universidad, en perío- 
dos diferentes. 


El proceso para realizar el diagrama consiste en una regla de tres. 


Para conocer el ángulo de cada sector se debe relacionar los 3600 
que tiene una circunferencia con el tamaño de la muestra y con cada una 
de sus frecuencias absolutas, así: 


360 ——n 
X ——F 


Por ejemplo, si la siguiente tabla representa el número de docentes de 
una universidad, clasificados por modalidad educativa. 


Modalidad 


Técnica 
Tecnología 
Universitaria 
Post-grado 


El diagrama circular se construirá así: 


360? —> 125 Donde 125 es el tamaño de la muestra y 
x——=> 5 5 la frecuencia en la primera modalidad. 
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360% x 5 
125 


Luego XA ss 


En el siguiente ejemplo, se muestra la distribución porcentual del nú- 
mero de estudiantes matriculados en 5 facultades de una universidad X, 
en los años de 1990 y 1998. 


DESCRIPCIÓN DE DATOS, TÉCNICA DE REPRESENTACIÓN 
GRÁFICA - AUTOEVALUACIÓN N 1 


Lea cuidadosamente cada uno de los siguientes enunciados y seña- 
le la respuesta correcta. 


1. El propósito principal de la estadística descriptiva es: 
Representar los datos por medio de histogramas. 
Obtener la información necesaria para la investigación. 
Medir en escalas nominales, ordinales e intervalos. 
Conocer las características generales de una distribución de 
frecuencias. 
Todas las anteriores. 


. Una distribución de frecuencias sólo se puede construir a partir de 
variables medidas en escalas intervalos. 


Sí No 
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¿Por qué? 


3. Si clasificamos 220 municipios en grandes, medianos y peque- 
ños, de acuerdo con el número de habitantes, de forma tal que 
tenemos 49 grandes, 63 medianos y 108 pequeños, ¿cómo los 
representaría en un histograma de frecuencias como en un diagra- 
ma circular? 


. Para construir un histograma de frecuencias, primero es necesa- 
rio construir un polígono de frecuencias. 


Sí No 


. En un examen general de matemáticas los 30 alumnos de un cur- 
so obtuvieron las siguientes calificaciones: 


Calificación N* de alumnos 


4 
y 
0 
2 
1 
0 
2 
2 
4 
5 
3 
0 
3 
2 
0 
1 
2 
1 


61 


Represente la misma información en una distribución de frecuencias, 
basada en intervalos. Determine el rango, el número de intervalos y 
la amplitud de los intervalos. Represente los resultados por medio de 
un histograma y un polígono de frecuencias. 


3. Gráfico 


4. No 


5. Rango = 17; número de intervalos = 6; amplitud de intervalo = 3 


Calificaciones F Frecuencia 
Relativa % 


61-63 13.3 
64-66 16.7 
67-69 26.7 
70-72 26.7 
73-75 10.0 
76-78 100.0 


Graficar 


LoN NOIOVNTIVAJOLNV VI V SVLSINASIY 


UVOLLSIANI V YIONIYAV :3143S 


Op 
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3. DESCRIPCIÓN DE DATOS - TÉCNICAS NUMÉRICAS 


La segunda técnica utilizada en la estadística descriptiva se basa en 
dos tipos de cálculos numéricos: Los de tendencia central y los de dis- 
persión. 


Las medidas de tendencia central se basan en que, en cualquier distri- 
bución de frecuencias, los valores tienden a concentrarse al rededor de 
un valor central de la distribución. 


Las de dispersión, por el contrario, se basan precisamente en la mane- 
ra en que los valores se distribuyen alrededor de esos valores centrales. 


Para entender la naturaleza de la distribución, tenemos que tratar de 
describir el centro de la distribución de las mediciones y la forma como 
éstas varían alrededor de ese centro. 


Podemos utilizar estas técnicas descriptivas, tanto para estudiar los 
parámetros de la población como las estadísticas de las muestras y en 
este último caso, a partir de ellas podemos estimar los correspondientes 
parámetros de la población. 


3.1 Medidas de tendencia central 


A continuación describimos las técnicas de tendencia central: moda, 
mediana y media aritmética. 


3.1.1 La moda 


La moda de una distribución se define como el valor que presenta la 
mayor frecuencia. Se usa con mediciones de escala nominal, ordinal, de 
intervalo o de razón. 


Es comúnmente utilizada como una medida de popularidad, que refle- 
ja la tendencia de una opinión. En algunas distribuciones sólo hay una 
moda, pero en otras puede haber dos o más modas. Si tomamos 1, 4, 4, 
4, 2,5, 5, 8, 3, 6, 5, vemos que tanto el cuatro como el cinco aparecen con 
más frecuencia y en tres ocasiones. Es decir, hay dos modas y la distribu- 
ción es bimodal. 


Cuando se trabaja con datos agrupados, la moda se refiere como el 
valor medio del intervalo que constituye la mayor frecuencia. 
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Tabla 5. Puntajes obtenidos por 50 alumnos de un curso de física 


Puntajes Frecuencias 


4 
4 
5 
7 
12 
7 
4 
3 
2 
2 


En la tabla 5, presentamos la distribución obtenida al estudiar los puntajes 
obtenidos por 50 estudiantes como calificación en un curso de física. 


El intervalo que contiene el mayor número de casos, o mayor frecuen- 
cia es 42 - 44. Este intervalo contiene los puntajes 42, 43 y 44. El valor 
medio del intervalo es, por lo tanto, 43 y lo denominamos como la moda. 


3.1.2 La mediana 


La mediana se define como la medida de tendencia central que divide 
a cualquier distribución en dos partes iguales. 
En la siguiente distribución: 


7,0,9,9,12,15,168,18,20, 21,23: 


La mediana es 15, porque se sitúa en el punto que divide la distribución 
en dos partes iguales. Hay el mismo número de casos antes y después 
del 15. 


La mediana se usa en variables medidas en escala ordinal, intervalo o 
de razón. Su mayor uso es cuando se tienen muchas observaciones y 
generalmente se utiliza en distribuciones de ingresos, edades, pesos. 


Cuando hay una distribución con un número par de casos, la mediana 
es el promedio de los dos valores medios. Así, en la siguiente distribución 
de notas: 


78,95,86,73,52,90,89,84,76,92 
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El valor de la mediana es 85, porque, primero al ordenar la distribución 
de menor a mayor así: 


52,73,76,78,84,86,89,90,92,95 


Siendo 10 el total de notas, las que aparecen en la posición quinta y 
sexta están en la mitad de la distribución, entonces la mediana será: 


84 +86 =85 
2 


Cuando se tiene información agrupada, la mediana se define como el 
valor dentro del intervalo que divide la distribución en dos partes iguales. 
El símbolo utilizado es Me. 


En la tabla 6, tenemos una distribución cualquiera con 5 intervalos de 
tamaño 5 y con 30 observaciones. 


Tabla 6. Distribución de frecuencias de los pesos de 30 estudiantes 


Frecuencias 
Intervalos acumuladas 


Los pasos a seguir para el cálculo de la mediana son: 


+ Encuentro las frecuencias absolutas acumuladas. 

+ Conbase en las frecuencias acumuladas ubico el intervalo donde que- 
de la frecuencias correspondiente a la mitad del tamaño de la mues- 
tra, es decir: n 

2 


+ Encuentro el valor del límite real inferior del intervalo donde está n 
2 


+ — Aplico la siguiente fórmula: 
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mí. La 
2 
Mediana = Li + ————— C 
En 
2 
donde Li = Límite real inferior donde está ubicada _ 
2 
XFa = Suma de las frecuencias anteriores a donde está 
ubicado U_ 
2 
C = Amplitud del intervalo. 
En el ejemplo anterior de los pesos de 30 estudiantes la mediana 
está dada por: 
_- 30 _15 


e. a = 
2 2 
Lf= 39.5 Corresponde al límite inferior donde está 15 como 
frecuencia acumulada. 
Fn _ 8 Corresponde a la frecuencia del intervalo donde está 
2 2 


YFa = 11 Corresponde a la suma de las frecuencias antes de cue 


2 
G=5 Es la amplitud del intervalo. 
Luego: 
. (15 - 11) 
Mediana = 39.5 + Y 5 
Mediana = 42 


3.1.3 La media aritmética 


Es la medida de tendencia central más conocida, es fácil de calcular, de 
gran estabilidad en el muestreo, sus fórmulas permiten tratamiento alge- 
braico. 
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Además, presenta el inconveniente de ser muy sensible a los valores 
extremos, cuando éstos son demasiado bajos o demasiado altos. Se re- 
presenta así: X 


La media aritmética se define como la suma de todos los valores ob- 
servados dividido por el número de observaciones (n). 
2x 
n 


La fórmula para datos no agrupados es: X= 


Donde X-Xi corresponde a la sumatoria de todos los valores de la 
muestra. 


La media aritmética de la siguiente distribución es: 


1.1,2,1,24,3,2,4.5 


Para las distribuciones con datos agregados, existe una fórmula, aun- 
que un poco más complicada, es bastante fácil de aplicar. 


media - DALI 
n 


donde f corresponde a las frecuencias, y X al valor de cada marca de 
clase. 


Tabla 7. De valores de los pesos de los 30 estudiantes 


Xx f 
Intervalos Marca de clase Frecuencias fx 


La marca de clase es el punto medio de cada intervalo. Para tal fin se 
suman los dos valores extremos y se divide entre dos. Por ejemplo, la 
marea de clase para el primer intervalo es: 
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Por consiguiente al aplicar la fórmula la media aritmética es: 


media _ 1:25 _ 4217 
30 


La media aritmética tiene sus ventajas, sobre las otras medidas de 
tendencia central, en que: 


+ Cada caso se incluye en el cálculo. 

+ Esrígidamente calculada, es decir, sólo hay una para conjunto de datos. 

+  Esimportante para hacer inferencias, es decir sirve también para cal- 
cular parámetros de la población. 


La media aritmética sólo se puede calcular a valores numéricos, es 
decir que estén en escala de intervalos o de razón. 


3.2 Medidas de dispersión 


Son aquellas que nos determinan cómo se agrupan o se dispersan los 
datos alrededor de un promedio. 


En este capítulo se estudiarán las medidas que se utilizan para deter- 
minar cuán bien representan los promedios a la distribución considerada. 


En el siguiente ejemplo se presentan las notas obtenidas por dos gru- 
pos de estudiantes: 
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Xa=79.5 
Xa = 79.7 


La media aritmética de ambas series es prácticamente igual (79.5 en 
el grupo A y 79.7 en el grupo B). Un análisis de las cifras individuales 
revelan un gran contraste. En el grupo A hubo muy poca variación entre 
las notas, siendo la más alta 83 y la más baja 75. En el grupo B, se nota 
mayor variación, en este grupo la mayor nota fue 97 y la menor 71. Como 
conclusión se podría decir que en el grupo B hubo notas muy altas y muy 
bajas. En el grupo A las notas tuvieron una mayor concentración alrede- 
dor del promedio. 


Para establecer esta característica se utilizan las medidas de varia- 
ción o dispersión, entre las cuales las más utilizadas son el rango, la 
varianza y la desviación estándar. 


3.2.1 El rango 


La medida más simple de dispersión es el rango. Este identifica la 
distancia entre el valor mayor y el valor menor de la distribución. Más 
específicamente, se define como la diferencia entre el mayor valor y el 
menor valor. Se simboliza por r. 


Ejemplo, el rango de la siguiente distribución es: 
25, 36, 64, 20, 48, 59. 
r=64-20=44 


El rango es sencillo de calcular pero tiene la desventaja de que es 
sensible a los valores extremos. 


3.2.2 Percentiles 


Los percentiles son usados para calcular una segunda medida de dis- 
persión. El P-ésimo percentil de un conjunto de mediciones ordenadas 
según su magnitud, es el valor que tiene P% de las mediciones por debajo 
de él y (100 P%) por encima. 


Se utilizan muy frecuentemente para describir los resultados de pruebas 
de conocimiento, como los del Sistema Nacional de Pruebas y en la clasi- 
ficación de personas en forma comparativa. Entre los percentiles de más 
interés están el 25, el 50 y el 75, frecuentemente denominados como el 
menor cuartil Q,, el cuartil mediano (mediana) Q, y el cuartil superior, Q,. 
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3.2.3 Varianza 

De todas las medidas de dispersión, la más importante, más conocida 
y usada es la varianza. Se define como la media aritmética de los cuadra- 


dos de las desviaciones, respecto a su media. Se simboliza por S?. 


Su fórmula es: 


- ¡ay 
s?_ 2aaaneta para datos no agrupados 


Y f (X - media)? 


Ses ————— datos agrupados 


Ejemplo con datos no agrupados 


X= 5;X,=3;X,=1;X, =6;X,=10 


x_3+3+1+6+10 25 5 
5 5 
se (5-5)%+ (8-5)? + (1-5)? + (6-5)? + (10-5) 
_ 5 
gs» _U+4+16+1+25 46 97 
5 5 


Lo cual indica que la varianza de los datos es de 9.2 
Ejemplo para datos agrupados 


Supongamos la siguiente tabla de pesos en kilogramos: 
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Tabla 8 - Pesos de 100 estudiantes de un colegio 


Marca de 
clase X (X- X)? Frecuencias f f(X- X)? 


donde X esla marca de clase 


X la media aritmética 
f la frecuencia de cada intervalo 


st= L520_. 852 
100 
Propiedades de la varianza 
a. La varianza siempre debe ser un valor positivo S*> 0 


b. La varianza de una constante es 0, es decir: si Xi = C para todo i, 
entonces S?* =0 


Cc. La varianza de una constante más una variable, es igual a la varianza 
de la variable. 


SiS, = 048% = 8% 
También es válida para la diferencia 
Ss? (k+x): = se E Si, =0- s?, a Ss? 


d. La varianza de una constante por una variable, es igual al producto de 
la constante al cuadrado por la varianza de la variable: 


Ss? Mx)" = k2 sí, 


50 SERIE: APRENDER A INVESTIGAR 


3.2.4 Desviación estándar 


La desviación típica estándar es la raíz cuadrada de la varianza, con- 
siderada siempre con signo positivo. 


Ss 48? 


Para el caso del peso de los 100 estudiantes del colegio la desviación 
estándar es: 


S = 18.52 = 2.92 


La varianza se expresa siempre en unidades diferentes a las originales, 
es decir, si la variable se refiere a peso en Kg, al calcular la varianza estará 
dado el peso en Kg al cuadrado. Es una de las razones por la cual se utiliza 
la desviación estándar, pues se expresa en las mismas unidades de la va- 
riable. 


3.2.5 Coeficiente de variación 


Esta medida relaciona la desviación estándar y la media, para expre- 
sar la variación de la desviación con respecto a la media aritmética. Se 
acostumbra expresarlo en porcentaje. 


La fórmula que se utiliza es: 


S 


Cv=—= 
Xx 


. 100 


El coeficiente de variación sirve para determinar el grado de homogenel- 
dad de la información. Si el valor del coeficiente de variación es pequeño 
indica que la información tiene un alto grado de homogeneidad y si el coefi- 
ciente de variación es grande es porque la información es heterogénea. 


Ejemplo: al hallar el coeficiente de variación de 6, 3, 4, 7, 8 


x-28 _56 
5 
S = 1.85 Cv - E — 0.3304 - 33.04% 


Lo cual indica que la información es homogénea, pues el coeficiente 
de variación es de 33.04%. 
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3.3 Asimetría 


Una distribución es simétrica si se tiene que: la media es igual diana e 
igual al modo (X = Md = Mo); pero si la distribución se vuelve asimétrica 
las tres medidas se separan y entonces el valor promedio ar será mayor 
que la mediana, que a su vez será mayor que el modo, deduciéndose que 
la distribución es asimétrica positiva. Si la media aritmética es menor que 
la mediana y ésta menor que el modo, se dice que la distribución es 
asimétrica negativa. En la distribución asimétrica positiva, la curva pre- 
senta un alargamiento a la derecha; en la negativa el alargamiento pre- 
senta hacia la izquierda. Véase gráficas 4. 


Asimétrica positiva Asimétrica negativa 
Md<Mo<X Md>Mo>X 


Md Mo X X Mo Md 


Gráfica 4. Asimetría 


Las fórmulas para calcular la asimetría y su grado son: 


As _ Media aritmética - Modo X - Mo 
Desviación estándar s 


As 3(Media aritmética - Mediana) 3(X - Ma) 


Desviación estándar Ss 


3.4 Kurtosis 


Una característica importante de la variación de algunas distribucio- 
nes es su grado de agudeza en la cima de la curva que las representa 
agudeza que se observa en la región del modo, comparada con las con- 
diciones halladas para el mismo sitio en la curva normal, es lo que 
Kurtosis. 
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Si la curva es más plana que la normal, la distribución se llama achatada 
o platicúrtica; si es más aguda, lleva el nombre de apuntada o leptocúrtica, 
y si la curva es normal, se denomina mesocúrtica. 


La Kurtosis es una medida de altura de la curva, por lo tanto está re- 
presentada por el cuarto momento de la media. En la misma forma que 
para la asimetría, su cálculo se efectúa en función de la desviación estándar 
y de los momentos unidimensionales de orden cuatro con respecto a la 
media aritmética. 


) m, m 
Su fórmulaes: a = — = 


4 
4 2 
SS) mé 


4 


Otra formula para medir la Kurtosis es la que se basa en los cuartiles 
y percentiles. 


En donde Q = 1/2 (Q,-Q,). Si el valor encontrado de la Kurtosis es 
¡igual a 0.263 se dice que la curva es mesocúrtica o normal; si es mayor, la 
curva es leptocúrtica y si es menor, la curva es platicúrtica. 


Por ejemplo, calcular el coeficiente de Kurtosis, si el valor del primer 


Aplicando la fórmula se tiene: 


K = A en donde Q 0) reemplazando 
Poo Po 2 
Se tiene Q = —— (90.75-68,25) _ —L (22.5) = 11.25 
2 2 
a A A PEA 


- 101.00-58.12 42.88 


Se puede decir que la curva es normal o mesocúrtica. 
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3.5 Tablas de contingencia 


En muchas ocasiones, la información puede organizarse y presentar- 
se de acuerdo con la relación entre dos o más variables. 


Es cuando se habla de tablas de doble entrada o múltiples entradas o 
comparación de colectivos. Las variables pueden ser categóricas o nu- 
méricas. 


Esta forma de representación presenta grandes ventajas, entre otras 
resume información y posibilita el análisis de dependencia, asociación, 
correlación y homogeneidad. 

Supongamos que a partir de datos disponibles en nuestro estudio se 
ha elaborado el siguiente cuadro: 


Tabla 9. Distribución de alumnos por jornadas y clase de colegio 


CLASIFICACIÓN DE NUMERO DE ALUMNOS 


LA JORNADA COLEGIOS COLEGIOS TOTAL 
OFICIALES PRIVADOS 


230 840 1070 
583 614 1197 
418 234 652 


Si comparamos los datos en dirección horizontal constatamos que el 
mayor número de estudiantes corresponde a la jornada de la mañana, 
mientras que si leemos los datos en dirección vertical el mayor número de 
estudiantes corresponde los colegios privados. 


En ocasiones el investigador desea especificar y analizar los datos 
con más variables. Para el ejemplo anterior podría ser sexo y edad. 
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Tabla 10. Distribución de alumnos por jornadas, 
clase de colegio, sexo y edad 


Clasificación COLEGIOS OFICIALES COLEGIOS PRIVADOS 


om] 62 00 | 22 [78 [102 [100 | 020 [ 105 
Pianara [21 [67 | 100 | 207 [261 | 192 | 60 [155 
ae [wee [rs [7 [0 


En este ejemplo, el 52 corresponde al número de estudiantes hombres 
entre los 10 y 15 años, de jornada única pertenecientes a colegios oficiales. 


Las tablas de contingencia se pueden realizar con frecuencias relati- 
vas, es decir, con porcentajes. 
ÍNDICE DE DISPERSIÓN CATEGÓRICO 


Para datos ordinales y nominales se utiliza el llamado ÍNDICE DE DIS- 
PERSIÓN CATEGÓRICO, cuya fórmula es: 
K(N? - Ef?) 
N?K - 1) 


Donde K es el número de categorías de la variable. 
Ef? es la suma de las frecuencias al cuadrado 
N = número de casos (tamaño de la muestra) 


Por ejemplo: 


Si tenemos la siguiente clasificación de 15 estudiantes por preferen- 
cias deportivas: 
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DEPORTES ALUMNOS 


FÚTBOL 


VOLEIBOL 
BASKET 


El índice de dispersión categórico sería: 


3(225 - 93) 
225(3 - 1) 

D_ 6 _ 088 
450 


Lo cual indica que los datos presentan una dispersión del 88%. 


DISTRIBUCIÓN DE DATOS, TÉCNICAS NUMÉRICAS 
AUTOEVALUACIÓN N* 2 


Lea cuidadosamente cada uno de los siguientes enunciados y seña- 
le la respuesta correcta. 


1. Para entender la naturaleza de la distribución de frecuencias, las 
medidas de tendencia central son mejores que las de dispersión 


Sí No 


2. Las medidas de tendencia central son-. 


3. ¿Cuál es la mediana de la siguiente distribución? 


AMA DD, 30511980, 1,759, Es LD 
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4. Un profesor pidió los pesos en Kg a 30 estudiantes del curso de 
álgebra y obtuvo los siguientes resultados: 


No. de estudiantes 
f 


a. ¿Cuál es el peso promedio de sus alumnos? 
b. ¿Cuál es la mediana? 


Cc. ¿Cuál es la moda de las edades? 


¿Cuáles son las modas de las siguientes series de números? 
a) 122, 103, 148, 113, 103, 118. 
b) 75, 84, 37, 49, 51, 83. 


c) 22, 43, 22, 38, 41, 43, 20. 


¿Cuál es la medida de dispersión más sencilla? 


El rango tiene la desventaja de ser sensible a los valores 
extremos. 


Sí No 
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8. La varianza siempre debe ser un valor positivo. 


Sí No 


9. ¿Cómo se define la Desviación Estándar? 


10. Una de las características de la Kurtosis es el grado de agudeza 
de la curva, la cual se puede clasificar en tres tipos: 


a. Una más plana que la normal 0: 
b. La segunda más aguda 0: 
Cc. Si la curva es normal 0: 


RESPUESTA A LA AUTOEVALUACIÓN N* 2 
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Taller de estadística N* 1 


Se realizó un experimento para evaluar el efecto de la edad en la fre- 
cuencia cardíaca, cuando se somete una persona a un grado específico 
de ejercicios. Se seleccionaron al azar hombres de cuatro grupos de eda- 
des, 10-19, 20-39, 40-59, 60-69. Cada individuo recorrió la banda sin fin a 
una velocidad específica durante 12 minutos y se registró el aumento de 
la frecuencia cardíaca, la diferencia antes y después del ejercicio, (en la- 
tidos por minuto) 


¿Qué puede usted concluir, si los siguientes datos son el resultado del 
procesamiento de la información apoyada en el computador. 


vammBLe | GmuPO1 |GmuPO2 | GmuPOS | GRUPOS 
10 12 42 


Talla 15 
Promedio 

Mediana 

Moda 

Varianza 

Desviación estándar 
Mínimo 


Máximo 


Rango 

Quartil inferior 

Quartil superior 

Rango interquartil 7.9 
Skewness -0.0873053 | -0.0716212 0.668752 
Kurtosis -0.612727 -1.59948 -0.726827 1.02909 
Coeficiente de variación 16.5391 17.7525 14.8465 18.5577 
Suma 452 275 354 460 


Preguntas 


1. ¿Qué tipo de muestreo se realizó? 
2. ¿Qué grupo fue más homogéneo en los resultados? ¿Por qué? 
3. Comparando las medias aritméticas ¿qué grupo obtuvo la menor 
media? 
4. ¿Qué grupo presenta un mayor rango? ¿Qué significa? 
5. Si consideramos el grupo 4 
5.1 ¿Cuál es el mínimo valor? 
5.2 ¿Cuál fue el mayor aumento de frecuencia cardíaca? 
5.3 ¿Qué porcentaje de la información está por debajo de 34.5? 
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5.4 ¿Qué porcentaje de la información está por encima de 34.5? 
5.5 ¿Qué porcentaje de la información está entre 34.5 y 42? 


6. Si consideramos el grupo 2 
6.1 ¿Qué porcentaje de la información está por encima de 32? 
6.2 ¿Qué valor corresponde al dato que más se repite? 
6.3 ¿Qué dato está ubicado en el primer cuartil? 
6.4 ¿Qué significado tienen las dos respuestas anteriores? 
Respuestas 
1. Muestreo aleatorio por estratos según edades. 
2. El grupo No. 3 porque obtuvo el menor coeficiente de variación. 
3. El grupo No. 2 con un valor de 27.5. 
4. El grupo No. 4 significa que obtuvo mayor variabilidad entre el dato 
mayor y el dato menor. 
5. Del -28 
5.2 54 
53 El25% 
5.4 El 75% 
5:59. El50% 
6. 6.1 El25% 
6.2 24 
6.3 24 


6.4 Significa que por debajo del dato que más se repite hay un 25% 
de la información. 
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4. INTRODUCCIÓN A LAS PROBABILIDADES 


4.1 Probabilidades elementales 


Consideramos varios ejemplos: es casi seguro que hoy no llueve, con 
ello expresamos algún grado de confianza de que no llueve, a pesar de la 
completa seguridad. 


¿Qué posibilidad existe de obtener una buena nota en el examen de 
economía? ¿En el de estadística? 


«En el próximo examen tengo la oportunidad de obtener una nota alta». 


Si un aficionado a la hípica es preguntado sobre una fija en una deter- 
minada carrera, puede darnos una insinuación de cuál caballo puede ga- 
nar. «El caballo X tiene una buena oportunidad». 


Nos encontramos con un conjunto cuya técnica se refiere a resultados 
que no estamos muy seguros. Asociamos cierto grado de confianza, con 
relación a que cada una de estas predicciones se realice. El cierto grado 
de confianza reposa en la experiencia (pasada y presente). 


Los Bayecianos definen la probabilidad de un acontecimiento, como 
una medida del grado de confianza que uno tiene, en que ocurra el acon- 
tecimiento. 


Otros autores consideran que la probabilidad pertenece a aquellas no- 
ciones imposibles de ser definidas adecuadamente y se les considera 
basadas en la experiencia. Por lo tanto, se puede decir que la probabilidad 
es una creencia basada en la experiencia. 


Consideramos algunas definiciones, según el método. 


a. Método axiomático. El cual concibe la probabilidad de ocurrencia 
de un suceso, como un número comprendido entre cero y uno. Este con- 
cepto tiene que ver directamente con la noción de frecuencia relativa, 
donde: O<p<l. 


Supongamos que se lanza 100 veces una moneda, anotamos el número 
de veces que sale cara y las veces que sale sello; los resultados fueron los 
siguientes: 


Frecuencias absolutas: cara 56 veces; sello 44 veces 
Frecuencias relativas: 56/100; 44/100 
Posibilidad: p = 56% (éxito); q = 44% (fracaso) 
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b. Método empírico o práctico. Considera la probabilidad de un su- 
ceso, como aquel número al cual se aproxima cada vez la frecuencia re- 
lativa de la ocurrencia de un suceso, cuando las veces que se repite el 
experimento que origina ese suceso es bastante grande. Este concepto 
tiene algo que ver con el experimento de Quetelet, en donde la probabili- 
dad de un suceso tiende a estabilizarse en un punto, cuando el número de 
experimentos se va haciendo cada vez más grande. 


c. Método clásico. Considera la probabilidad como el cuociente de 
dividir los casos favorables, que pueden ocurrir en un suceso, por el total 
de casos posibles. 


Número de casos favorables 


Número de casos posibles 
Ejemplos: 


— En el lanzamiento de una moneda hay: 


2 posibilidades N* Combinaciones Probabilidades 
C (C) 112 =05 
S (S) 12.05 
2 1=1.0 


— Lanzamiento de dos monedas. 


4 Posibilidades N* Combinaciones Probabilidades 
e (C,C) 1 1/4 =0.25 
1Cy1S (C, S) (S, 0) 2 2/4 =0.50 

28 (S,S) 1 1/4 = 0.25 

4 1=1.00 


— Lanzamiento de tres monedas. 


8 posibilidades N* Combinaciones Probabilidades 
16 (056) 1 1/8 =0.125 

2C y 1S (C, C, S) (C, S, C) (S, C, C) 3 3/8.=0.375 
2Sy 1C (S,S,C)(S,C,S)(C,S,S) 3 3/8=0.375 

38 (S, S, S) 1 1/8=0.125 

8 1=1.000 
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En efecto el número de casos posibles en los ejemplos anteriores se 
obtiene: 


ais Pad 
22=4 2 = casos posibles en una moneda 
2=B n = número de lanzamientos 


En un dado sería: 6" 


6"=86 6 = casos posibles en un dado 
6? = 36 36 = casos posibles al lanzar dos dados 


4.2 Esperanza 
Si p es la posibilidad de éxito en un suceso, en un solo ensayo, el 
número de sucesos o esperanzas de ese suceso en n ensayos, estará 
dado por el producto de n y la probabilidad de éxito p. 
E=np 


Ejemplo: 


En el lanzamiento 900 veces de dos dados, ¿cuál es la esperanza de 
que la suma de sus caras sea un valor menor a 6? 


Primero obtenemos la probabilidad de éxito del suceso en un solo 
ensayo. 


(1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (3,1) (3,2) (4,1) = 10 
Como se lanzan 900 veces, en dos dados, se tiene: 
E = np = 900 10 - 900 =- 250 
36 36 


La esperanza es que en 250 de los 900 lanzamientos, la suma de sus 
caras sea menor de 6. 


4.3 Leyes de las probabilidades 
Para facilitar el cálculo de las probabilidades se emplean estas leyes. 


1. Sidos o más sucesos son tales que solamente uno de ellos puede ocu- 
rrir en un solo ensayo, se dice que son mutuamente excluyentes. Se 
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denomina probabilidad aditiva y será igual a la suma de las probabilidades 
de cada suceso. 


P=P,+P>2+Ps O +P, 
Ejemplo: 
La probabilidad de obtener un as o un rey, sacando una sola carta en 


una baraja española de 40 cartas. Si uno de los casos aparece, queda 
excluido el otro. 


po 2 (As) 
40 10 
4 1 
P, = — = (Rey) 
40 
A A E A 
10 10 5 


2. Se dice que dos o más sucesos son independientes, si la probabilidad 
de presentación de alguno de ellos queda influenciada por la presenta- 
ción del otro. En caso contrario, se dice que son dependientes. 


En otras palabras, si el resultado de un suceso no afecta al otro, se 
dice que son independientes, por lo tanto se efectuará la multiplicación 
de las probabilidades para cada suceso. 


PSP XP. Pusnis CP, 
Ejemplo: 


¿Qué probabilidad tendremos de obtener dos reyes, sacando una car- 
ta de una baraja y la otra de una segunda baraja? 


IN 16 Y 
40 40 1600 100 


Se dice que los sucesos son dependientes, o eventos compuestos, si la 
ocurrencia o no ocurrencia de un evento en cualquier prueba afecta la 
probabilidad de otros eventos en otras pruebas, es decir que la probabi- 
lidad del segundo suceso depende del primer suceso, el del tercero, de 
lo que haya sucedido en el primero y segundo y así sucesivamente. 
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Ejemplo: 
La probabilidad de obtener tres ases, sacando sucesivamente tres 


cartas de una baraja española, sin volverlas a incluir (sin reposición) 
en el montón. 


e. Hua. a 
1 40 27 39 3” 38 
p_ 4,3 ,2__24 
40 39 38 59280 
4 
P = 


2470 


4.4 Análisis combinatorio 


El análisis combinatorio es un sistema que permite agrupar y ordenar, 
en diversas formas, los elementos de un conjunto. 


Los tres principales tipos de análisis combinatorio son: 
4.4.1 Permutaciones 


Se denominan permutaciones de n elementos, los diferentes grupos 
que se pueden hacer, tomándolos todos cada vez. 


Las permutaciones implican orden. 


Cada conjunto ordenado de n elementos se denominará una permuta- 
ción de los n elementos diferentes. 


La formula es P, = n!, donde P, corresponde al número de permuta- 
ciones posibles. 


Por ejemplo: 
Determine el número de permutaciones posibles de las letras A, B, C, D. 
P,=4l=4x3x2x1=24 


Representémoslas: 
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ABCD 
ABDC 
ACBD 
ADBC 
ADCB 
ACDB 


Otro ejemplo: 


BACD 
BADC 
BCDA 
BDAC 
BDCA 
BCAD 


CABD 
CADB 
CBAD 
CDAB 
CDBA 
CBDA 


DABC 
DACB 
DBAC 
DCBA 
DCAB 
DBCA 
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¿Cuántos números diferentes de 9 cifras se pueden formar con los dígitos 
del cero al 9, usándolos una sola vez? 


Pjp= 101=10x9x8x7x6x5x4x3x2xX 1= 3.628.800 


Permutaciones con repetición 


Las permutaciones con repetición r, son un caso particular de las variacio- 
nes y no existe una ley sencilla para su formación. Dado lo complicado del 
sistema, sólo, se presenta la fórmula que logra el número de esta clase de 


permutaciones. 


Sean los elementos aa - bbb - cc - d, para permutar con repetición, ten- 
dremos 8 elementos repartidos así: dos del primero, tres del segundo, dos 
del tercero y uno del cuarto, entonces las permutaciones se presentarán 


así: 


P,(r: 2,3,2,1) y la fórmula respectiva será: 


P.(r:2,3,2,1) 9! 


213121 


P,(r:2,3,2,1)=1680 


La formula será  P (rr, r?) 


Ejemplo: 


n! 


r,!r,! 


8x7x6x5x4x3x2x1 
2x1x3x2x1x2x1 


¿De cuántas maneras distribuiríamos 3 monedas de $100 y 4 monedas 
de $500 en una misma línea? 


Pra) Zi 


311 
P,(r: 3,4) = 35 


7x6x5x4x3x2x1 


3x2x1x4x3x2x1 
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Otro ejemplo: 


Cuántos grupos de 2 letras se pueden formar con las letras de la palabra 
amigas. 


4.4.2 Variaciones 


Las variaciones corresponden a aquellas permutaciones donde los ele- 
mentos no se toman en su totalidad. 


Dado un conjunto de n elementos diferentes, se denominará permutación 
parcial o variaciones, de subconjunto de r elementos (r<n) pertenecientes al 
conjunto dado. 


n! 


La fórmula es: V” _ 
(n - r)! 


En el ejemplo de las cuatro letras o elementos (n) vamos a permutar de a 2 (r) 


SS EA 
(4 - 2)! 2x1 
AB BA CA DA 
AC BC CB DB 
AD BD CD DC 
Ejemplo: 


¿Cuántas cifras diferentes de 4 dígitos se pueden formar con los dígitos 
del 0 al 9, usándolos una vez? 


| 
10! A 10x9x8x7x6x5x4x3x2x 1 _ 5.040 


Y 
(10 - 4)! 6x5x4x3x2x1 


4= 


4.4.3 Combinaciones 


Son aquellas en las que no interesa el orden de la aparición de ele- 
mentos del conjunto. Será lo mismo AB que BA. 
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Cuando se toma la totalidad de elementos, solamente se puede hacer una 
combinación. Si se tiene las letras A, B, C, D y se combinan de dos en dos, se 
obtienen 6 casos: 


AB BC CD 
AC BD 
AD 


La fórmula será: 


o. 
ri(n - r)! 


Y se lee combinación de n elementos tomados de r en r. 
Ejemplo: 
Cuál es la combinación de las 4 letras A, B, C, D, tomadas de 4 en 4. 


4! 4x3x2x1 
Ya A A 
41(4 - 4)! 4x3x2x1x1 


El factorial de cero es uno (0! = |). 
En la combinación de estas 4 letras tomadas de 2 en 2 será, 


| 
obli E a AA 
2 2 
21(4 - 2)! 2x1x2x1 


4.5 Probabilidad condicional 


En algunos eventos probabilísticos se tiene alguna información, que 
reduce el espacio muestral original a uno de sus subconjuntos; las probabi- 
lidades asociadas a esos subconjuntos determinan la probabilidad condi- 
cional. 


Su fórmula está dada así: 


P(BNA) 


P(B/A) = pra) 


Ejemplo: 
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El 18 % de las familias de un barrio tienen vehículo propio, el 20% tiene 
vivienda de su propiedad y el 12% tiene vivienda y vehículo. ¿Cuál es la posi- 
bilidad de tener vivienda si se tiene vehículo? 

A= Propietario de vehículo 

A'= No propietario de vehículo 


B Propietario de vivienda 


B”  Nopropietario de vivienda 


INTRODUCCIÓN A LAS PROBABILIDADES 
AUTOEVALUACIÓN N* 3 


La definición clásica de probabilidades es el cociente de dividir el 
número de casos favorables que pueden ocurrir en un suceso, por 
el número de casos posibles: Sí No 


¿Cuál es la probabilidad de que una bola, extraída al azar de una 
urna que contiene 3 bolas rojas, 4 blancas y 5 azules, sea blanca? 


a. 3/12 
b. 1/3 


c. 5/16 


d. Ninguna 


MÓDULO 4: ANÁLISIS DE LA INFORMACIÓN 69 


3. Una señora invita a cenar a 8 personas; después de sentarse ella, 
¿de cuántas maneras se pueden sentar sus invitados? 


En un juego de moneda, entre dos personas, con un premio de 
$1.000 por aparición de cara, ¿cuál es la esperanza de ganar con el 
resultado de cara? 


¿De cuántas maneras se pueden sacar dos manzanas de una caja 
que contiene 8 manzanas? 


RESPUESTAS A LA AUTOEVALUACIÓN N' 3 


82 =%0 * 
00S$ *' 


Oce'0py * 
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4.6 Distribución binomial 

En repetidos ensayos, siendo p la probabilidad de éxito en un solo ensayo 
la cual debe permanecer fija y q la probabilidad de fracaso, entonces la proba- 
bilidad P de que se obtengan r éxitos en n ensayos, es el termino del desarro- 
llo binomial (q+p)". 

La fórmula general será: 

p = Cr, pr ql” 

Los criterios que deben satisfacer una experiencia binomial son: 


a) Existir un número fijo de pruebas repetidas (n). 


b) Cada una de las n pruebas debe tener dos resultados: favorable o desfa- 
vorable; en el caso de una moneda será: cara o sello. 


Cc) La probabilidad de éxito de un acontecimiento es fija. 
d) Las pruebas son independientes. 
e) Nos interesa el número de éxitos en n pruebas. 


En caso de lanzar 4 monedas y se quiera determinar la probabilidad de 
obtener exactamente dos caras, será: 


2 4-2 2 2 
poo W1 NA] _ 4 1 fa) 4321 11 
2) 12 ora (2) (2 2.121 14) 14 
6/11 -J£l - 0.375 = 37.5% 
16 (16 


4.7 Distribución normal 


= 
l 


Muchas distribuciones de mediciones, que se hacen tanto en las cien- 
cias sociales como en las ciencias naturales, tienden a tener un polígono 
de frecuencias con una forma que se asemeja al corte transversal de una 
campana. 


Esta distribución se observa más cuando el número de observaciones 
es grande y cuando en muchos casos las investigaciones se realizan con 
muestras de poblaciones grandes; en la mayoría de los casos las distri- 
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buciones tienden a aproximarse a la curva en forma de campana ya men- 
cionada. 


Una distribución de frecuencias que se asemeja a una campana se reco- 
noce como una Distribución Normal, que por tener características especia- 
les, se convierte en un requisito fundamental para entender el proceso rela- 
cionado con la inferencia estadística y la prueba de hipótesis. 


Cuando el número n de experimentos es grande, se hace difícil el cálculo 
de las probabilidades mediante el teorema del Binomio; para facilitar el cálculo 
y agilizar las operaciones, utilizaremos la distribución normal. 


Entre las propiedades de la distribución normal están, 


a. El área total debajo de la curva, puede representar el número total de ele- 
mentos en una población y se puede considerar que el área es igual a la 
unidad. 


Esta propiedad permite determinar la proporción de la frecuencia conteni- 
da entre dos puntajes a lo largo del eje horizontal, ya que se puede calcular 
la proporción del área debajo de la curva y contenida entre los dos puntos. 


b. La media aritmética, la mediana, y la moda de una distribución normal son 
iguales a cero. 


Cc. La desviación estándar es igual a 1 
d. Como veíamos, tiene una distribución simétrica. 


e. Esuna distribución asintótica, es decir, como no toca el eje de las X, se 
extiende infinitamente. 


f. Enuna distribución normal el 68.26% de los valores bajo la curva, se en- 
cuentra dentro de más o menos una desviación estándar de la media arit- 
mética; el 95.46% de los valores debajo de la curva se encuentra dentro 
de más o menos dos desviaciones estándar de la media y el 99.9% se 
encuentra dentro de más o menos tres desviaciones estándar, tal como 
se ve en la gráfica 5. 


La curva está dada por la función: 
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n número de datos 

G desviación estándar de la distribución binomial =Vnpg 
e base de los logaritmos naturales = 2.71828 

T 3.1416 

u media de la distribución nominal = np 


X 
Mediana 
Moda 


Gráfica 5. Características de una distribución normal. 


Probabilidad mediante una aproximación a la curva normal 
X y Y son cantidades concretas de la misma especie. La variante esta- 


dística z _ 4%, representa una medida de las desviaciones estándar o 
G 

de las G llamadas unidades estandarizadas. La expresión anterior también 

es conocida como desviación normal. Aplicando la fórmula podemos cal- 

cular la probabilidad, por ejemplo de obtener 4, 5 y 6 caras, en 9 lanza- 

mientos de una moneda, mediante una aproximación a la binomial. 
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M=39 p=% q=% 
4 =p =9 (14) =4.5 


G =Vnpg =V/9 (1%) (12) = 1.5 
p = (3.5 < x <6.5) 


x=4,5 y 6 caras 


0.6568 


Gráfica 6. 


Se tiene que x 3.5 corresponde al límite inferior de 4, y x 6.5 es el límite 
superior de 6. Se va a buscar el valor del área comprendido entre 3.5 y 6.5, 
o sea, P (3.5<x<6.5). Primero localizamos el área a partir de la media 
hasta el límite inferior, dado que cada lado vale el 50%, la suma total será 
igual a uno. 


De donde z - == entonces z = —— - -0.67 


z = (-0.67) = 0.2486, tomado de la tabla, área bajo la curva normal. 
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15 


Z = 1.33 = 0.4082, tomado de la tabla, área bajo la curva normal. 
Se desea el área comprendida entre z = -0.67 y z = 1.33 
Para ello sumamos: 0.2486 + 0.4082 = 0.6568 


La probabilidad de que aparezca 4, 5 y 6 caras es del 65.68%. Véase 
gráfica 6. 


Ejemplos: 


Usando la tabla del área bajo la curva normal, plantearemos algunos 
problemas que servirán de modelo. Ver gráficas: 7 - 8 - 9 y 1 0. 


a) Paraz=1.5yz=-1.4 
z =1.5 la tabla da 0.4332 z =1.4 la tabla de 0.4192 
p (-14<z<1.5) = 0.4332+0.4192 


p 0.8524 = 85.24% 


-1,4 0 1.5 Z 


Gráfica 7. 
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b) Si se plantea p (z<1.5), corresponde al siguiente gráfico. 
0.5000 + 0.4332 = 0.9332 = 93.32% 


0 1.5 


Gráfica 8. 


c) P (z>1.5) 
0.5000 - 0.4332 = 0.0668 =6.68% 


0 1.5 


Gráfica 9. 


76 SERIE: APRENDER A INVESTIGAR 


d) Si queremos conocer el porcentaje de frecuencia comprendida entre 


zZ=-3yZ=-2, será necesario proceder por diferencia. 


z = -3 = 0.4987 
> 9 - 0.4772 
0.0215 


La diferencia es 0.0215 = 2.15% 


P (-3<Z<-2)= 2.15% 


Gráfica 10. 


4.8 Distribución de Poisson 


Se tiene ahora una distribución binomial, cuando n es grande, por lo gene- 
ral mayor de 50, a la vez que p, la probabilidad de éxito de un suceso se 
acerque a cero, mientras que q, la probabilidad de fracaso, se aproxime a 
uno, de tal manera que el producto np, llamado lamda A es menor o igual a 5, 
debe utilizarse la distribución de Poisson. 


Su fórmula es: 


Me? 


== 


donde e = 2.71828 
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A=np 

Xx = número de casos favorables 

Ejemplo: 

Si el 1 % de las bombillas fabricadas por una compañía son defectuosas, 
hallar la probabilidad de que en una muestra de 100 bombillas 3 sean 


defectuosas. 


A»=100x0.01 =1 
X=3 


e-* (utilizamos la tabla para valores de e”) 
e-* = 0.36788 


Si, la probabilidad de que una persona adquiera la enfermedad como 
consecuencia de una vacuna contra la misma, es 0.0002, ¿cuál es la 
probabilidad de que la adquieran exactamente 5 personas en una po- 
blación de 10.000 vacunados? 


Mm, e? 
p = 
Xi! 

A =np = 10.000 x 0.0002 = 2 
x=5 

2* (0.13534) 32(0.13534) 4.33088 
entonces P = ---—_ _.- IZ — 

5.4.3.2.1 120 120 


P = 0.03609 = 3.61 % 


P (x= 5) = 3.61 % 
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LA CURVA NORMAL Y SUS APLICACIONES 
AUTOEVALUACIÓN N* 4 


La curva normal se caracteriza por que es asimptótica. Esto quiere 
decir que: 


a. La media es igual a la moda 


. Tiene forma de campana 


. Es simétrica 


. Nunca toca el eje 


. Ninguna de las anteriores 


La tabla bajo la curva normal sirve para indicar cuál es: 


a. La proporción de los casos que se encuentran entre la media y 
un valor llamado puntaje 


b. El valor de la desviación estándar en relación con el valor de la 
media 


En una distribución normal, la media, la mediana y la moda son 
iguales: 


No 


¿Cuál es el área bajo la curva normal que corresponde a un z = 
207 


El promedio de las notas de un curso está en 1.350 puntos y tiene 
una distribución normal con una desviación estándar de 18 puntos. 


. ¿Qué porcentaje de alumnos tiene notas entre 1.350 y 1.377 
puntos? 


. Entre 1.365 y 1.377 


. Entre 1.31 y 1.351. 
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Con una distribución de 20 elementos se obtiene una media de 20.3 
y una desviación estándar de 2.81. Si uno de los elementos tiene un 
valor de 28, ¿cuál es el valor de z? 


17.18 


E E TO 


. 2.74 


. 5.48 


. Ninguno de los anteriores 


En una distribución normal, el 68.26% de los valores bajo la curva 
se encuentra dentro de más o menos una desviación estándar de la 
media aritmética. 


8. Enuna distribución binomial, cuando n es pequeña, se utiliza la dis- 
tribución de Poisson. 


Sí No 


RESPUESTAS A LA AUTOEVALUACIÓN N' 3 


ON=8 IS=Z  puzlo=9  “%pyL Lz(9 :s9 eL (q 


:%3e ev(e=9g -08€ 6P=V -1IS=8 “-B=3 -p= | 
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5. ESTADÍSTICA INFERENCIAL 


Ayuda a determinar la confiabilidad de la inferencia de que los fenóme- 
nos observados en la muestra ocurrirán también en la población de donde 
se seleccionó la muestra. Es decir, sirve para estimar la eficacia del razo- 
namiento inductivo con el cual se infiere que lo que se observa en una 
parte se observará en el grupo entero. 


El objeto de la estadística es el de hacer inferencias (predecir, decidir) 
sobre algunas características de la población con base en la información 
contenida en una muestra. 


Por lo tanto, se puede afirmar que el empleo de la estadística inferencial 
presume el dominio de la estadística descriptiva. Sin embargo se debe 
tener presente que al predecir un resultado o tomar una decisión se está 
sujeto a una incertidumbre o margen de error, bien sea por la técnica de 
muestreo o por la selección del estadístico de prueba. 


Es importante resaltar que se debe diferenciar entre las técnicas que 
son válidas para el análisis de los datos cualitativos y de los datos cuanti- 
tativos. 


En el caso de la estadística inferencial el investigador se encuentra 
con dos tipos de técnicas. Por un lado las técnicas paramétricas que 
suponen una serie de supuestos acerca de la naturaleza de la población 
de la que se extrajo la muestra de estudio. Por otro lado, las técnicas no 
paramétricas, que no requieren supuestos sobre las características de la 
población y que se facilitan más para el análisis de datos nominales y 
ordinales. 


Las ventajas de las técnicas paramétricas es que son más potentes 
que las no paramétricas y por consiguiente las inferencias que se realizan 
son más fiables. El inconveniente es que el investigador no siempre pue- 
de cumplir con los requisitos y supuestos que exige el enfoque paramétrico, 
sobre todo en investigaciones educativas y sociales. 


La ventaja de las técnicas no paramétricas es que son fáciles de utili- 
zar y algunas son tan potentes como las paramétricas. 


El análisis de datos cualitativos ha generado técnicas propias, que ac- 
tualmente constituyen toda una metodología específica que viene marcada 
por la propia idiosincrasia cualitativa y que toma determinadas opciones en 
relación a las unidades de registro de los datos y la forma de tratarlos. 
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Actualmente existe interés por sistematizar estos procedimientos, sin 
embargo esta tarea es difícil debido al carácter abierto y flexible de la me- 
todología, los diversos enfoques, y la variedad de objetivos científicos que 
puede cubrir. 


Una de las maneras de realizar estimaciones es con las pruebas de 
hipótesis referentes a sus valores. 


En muchos aspectos el procedimiento formal para la prueba de hipó- 
tesis es similar al método científico. 


5.1 La prueba de hipótesis 


Ya el investigador, desde el momento en que identifica y delimita el pro- 
blema que va a investigar, ha aclarado los elementos conceptuales y las 
hipótesis o modelos que tiene que probar. En las etapas complicadas con 
la generación de los instrumentos, con la recolección de la información y 
con la codificación de la misma, estas hipótesis se aclaran mucho más y 
en algunos casos, toman características cuantitativas, permitiendo la apli- 
cación de técnicas estadísticas, para probar su relevancia en cuanto a su 
capacidad para generalizar el fenómeno, o la relación entre fenómenos, a 
poblaciones mayores, o para tomar decisiones en relación con tales fenó- 
menos. 


En esta parte distinguiremos la lógica del proceso para probar una hi- 
pótesis y aplicaremos en casos determinados la prueba Z, la prueba T y la 
prueba de significación entre muestras, para ilustrar el proceso de prueba 
de hipótesis. 


La lógica de la prueba de hipótesis 


En el proceso de la estadística inferencial, hay dos tipos de hipótesis 
claves: una es la hipótesis de investigación (H,), que simplemente señala 
la existencia de un hecho o de un evento, o la relación entre dos o más 
fenómenos. 


La otra es la hipótesis nula (H,) que se construye artificialmente para 
que el investigador evalúe su hipótesis de investigación. 


Si la hipótesis de investigación afirma que existe una relación entre dos 
o más fenómenos, la hipótesis nula (H,) plantea que no existe relación 
entre los dos fenómenos. 
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Es decir, se utiliza esta última como un modelo para probar la hipótesis de 
investigación, o sea, probar su veracidad o su falsedad. 


Para probar una hipótesis, se necesita: 
1? La existencia o planteamiento de la misma. 


2” Que se anticipen los eventos que pueden resultar a partir de la observa- 
ción o experimentación. 


3” Que se especifiquen las condiciones bajo las cuales la hipótesis se puede 
rechazar o aceptar. 


4 Que se haga el experimento y la observación y que se analice el evento o 
resultado. 


5 Que se tome la decisión de rechazar o aceptar la hipótesis. 

Esto implica que, aunque se tiene que observar o experimentar, todas las 
suposiciones se hacen antes de las mismas observaciones o experimentos. 
Es decir, el investigador predice y luego bajo las reglas del juego de su predic- 
ción evalúa en relación con los resultados. Si éstos no son consistentes con 
lo que se predijo, se rechaza la hipótesis. 

Con un ejemplo podemos ilustrar la naturaleza de la prueba de hipótesis. 
Supongamos que se está probando una nueva semilla para resolver proble- 
mas de productividad en una región determinada. La hipótesis de la investiga- 
ción sería que la media aritmética por fanegada es mayor de 519 arrobas, que 
es el tradicionalmente observado en esa región. 

Para verificar la hipótesis tenemos que completar los cinco pasos siguientes: 
1? Aclarar la hipótesis de investigación H, y crear la hipótesis nula H.. 

2” Obtener la distribución del muestreo. 
3” Seleccionar un nivel de significancia y una región de rechazo. 


47 Hacer la prueba estadística. 


5 Comparar y concluir. 
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Punto 1 


El paso uno se define en el enunciado del problema. Para que sea verifica- 
da H,, el proceso a seguir es contradecir a H,, es decir, hay que contradecir 
que la media aritmética es igual o menor a 519. 


Entonces las dos hipótesis se representan así: 


H,¡: X> 519 
Ho: X<519 


Con lo anterior, lo que se está diciendo es que, si encontramos que el 
promedio de producción por fanegada es de 519 arrobas o menos, tendre- 
mos que concluir que nuestra hipótesis inicial H,, tendrá que ser modificada y 
por lo tanto, la nueva semilla, por lo menos en cuanto a su productividad, no 
es competitiva con las tradicionalmente utilizadas. 


Punto 2 


Una vez aclaradas las suposiciones del punto 1, acerca de H, y H,, por 
medio de un razonamiento matemático podemos obtener la distribución de 
muestreo, o sea, la distribución de todos los posibles valores que una estadís- 
tica puede tener, con base en un muestreo probabilístico de un universo. 


Esta distribución nos dice, entonces, qué probabilidad hay de obtener cada 
uno de los resultados. 


Dependiendo del tamaño de las muestras, las distribuciones de muestreo 
tienden a tomar una distribución normal y por ello no es necesario calcularlas. 


Un teorema importante, que es una aplicación de la distribución normal, 
conocido como el teorema del Límite Central, dice que si en una población 
de tamaño N, con una media de u y una varianza de S? se obtienen mues- 
tras al azar, la distribución de las medias de las muestras seleccionadas 
será normal -y más lo será en la medida en que se incremento el número de 
muestras seleccionadas- y tendrá una media de Y y varianza S?/N. 


El teorema garantiza que la media de una muestra puede estar muy cer- 
cana al de la población, en la medida en que tenga un tamaño n grande, ya 
que la varianza de la distribución de las medias muestrales S/N, se hace 
más pequeña en la medida en que aumenta el tamaño n. 


La desviación estándar de la distribución de las medias de la muestra se 
denomina como el error estándar: S/ /N 
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Punto 3 


A partir de la información obtenida, el investigador puede escoger resulta- 
dos que permitan aceptar o rechazar sus supuestos. Posteriormente, los re- 
sultados identificados para rechazar la suposición se llaman de región crítica, 
dividiendo así los resultados en los que sirven para rechazar y los que sirven 
para aceptar la hipótesis nula, sabiendo que estos sectores están relaciona- 
dos con errores de tipo a y É. 


Una vez aclaradas la H, y H,, obtenemos aleatoriamente una muestra de 
”x” 1 0 . "xs 
la producción por fanegada de la semilla probada en la región. 


Calculamos la media aritmética y la desviación estándar de los datos de la 
muestra, información ésta que nos permite hacer la prueba estadística. 


Si calculamos X, sabemos que la distribución de muestreo de x, supo- 
niendo que H, es cierto, es bastante aproximada a una distribución normal 
con un u = 519. 


Valores de x, que contradicen H, y por lo tanto validan a H,, serán aque- 
llos que se encuentran en la región de la cola derecha de la distribución, 
como lo señala la figura 11. Estos valores contradictorios generan la re- 
gión de rechazo, es decir, si el valor observado de x cae en la región de 
rechazo, descartamos H, y aprobamos H,. Observemos que se verifica H, 
contradiciendo H,. Por lo tanto si x cae en la región de aceptación de la 
figura 11, aceptamos H, y no podemos verificar H,. Esta es la etapa de 
comparación con la región de rechazo. 


Gráfica 11. Suponiendo que H, es verdadera, los valores 
contradictorios de X están en la cola superior. 


Valores que 
contradicen a X 


X =519 
Región de 


*—————————— Región de recepción rechazo 
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Hay posibilidad de cometer dos tipos de errores al probar la hipótesis. 
Podemos, como en cualquier proceso de decisión entre dos escogencias, 
cometer el error de rechazar a H, cuando en realidad es verdadera; error 
tipo 1 ó a; o podemos aceptar H, cuando en realidad es falsa; error tipo Il ó f. 
Y aunque es conveniente determinar la región de aceptación y de rechazo, 
minimizando tanto el error tipo a. como el error tipo f, esto no es imposible 
porque están inversamente relacionadas, es decir, para una muestra de 
tamaño n, cuando se cambia la región de rechazo para incrementar el error 
a, el error KB disminuye y viceversa. 


Para resolver este problema, la comunidad de científicos ha decidido 
que se debe trabajar con la probabilidad de cometer error tipo | ó a. y la espe- 
cificación del valor para el error tipo a, determina la región de rechazo. 


¿Cómo se hace? Volviendo a nuestro ejemplo, sabemos que rechazamos 
H, si obtenemos grandes valores de x. 


Si tenemos una muestra de 36 terrenos de una fanegada, como mues- 
tra del estudio y si la media aritmética es X = 573 y la desviación estándar 
es S = 124 la pregunta clave sobre la cual tenemos que tomar una deci- 
sión es si el X para toda la región es mayor que 519. 


Para concluir, decidimos el valor del error a.con el cual queremos traba- 
jar; siempre sabemos que hay la posibilidad de cometer un error. Si en este 
caso queremos correr el riesgo de equivocarnos 1 de cada 40 decisiones, 
es decir de rechazar incorrectamente H, entonces a = 1/40 = 0.025 


Como suponemos que H, es verdadera, x está distribuida normalmen- 
te y tiene u = 51 9 y una desviación estándar de: 


S _124 _ 20.67 
/N 136 
Punto 4 


Supongamos que en la figura 11 la región rayada sea la equivalente a la 
de un a = 0,025. Para calcular el punto de rechazo, se tiene que calcular el 
valor de Z, que tiene un área de 0.025 a su derecha. En la tabla de áreas 
bajo la curva normal vemos que el valor correspondiente es de 1.96, por lo 
que lo designaremos como el límite para la región de rechazo y si el valor 
observado de x es mayor que 1.96, desviaciones estándar arriba de u= 159, 
se rechaza la hipótesis nula. 
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Cuando el valor de X es igual a 573 y el de S es igual a 124, el valor de 
Z normalizado es: 


X-H 73-519 54 


LE S A 
EJ 124 20.67 
/N Y 36 
Punto 5 


El último paso es comparar el valor obtenido con el dispuesto como 
rechazo, ya que X encontrado está a más de 1.96 unidades de desviación 
estándar arriba del u = 519, rechazamos H, en favor de H, y concluimos 
que la productividad de la nueva variedad de semilla es significativamente 
mayor que 519. 


5.2 Pruebas de significancia de muestras únicas o simples 


Cuando se quiere probar hipótesis a partir de una muestra única, se 
pueden utilizar varias pruebas de significancia de hipótesis. En estudios 
en ciencias naturales y ciencias sociales es muy frecuente este tipo de 
situaciones y las técnicas utilizadas más frecuentemente son la prueba Z, 
y la prueba t frecuentemente llamada t de Student. 


5.2.1 Prueba Z 


Normalmente se utiliza cuando se conoce el parámetro de la pobla- 
ción. llustremos su uso con el siguiente ejemplo hipotético: 


En una institución de enseñanza media se presenta una deserción que 
los directores consideran muy alta y pensaron que con un programa de 
consejería, podrían controlarla, con la hipótesis de que cuanta más guía 
personal, mayor sería la probabilidad de continuar exitosamente en la 
institución. Se generó una consejería y al cabo de un año se recopiló infor- 
mación sobre el número de veces que cada estudiante tuvo contacto for- 
mal con un consejero. 


La media aritmética para el total de estudiantes fue de 12.1 visitas al 
año, con una desviación estándar de 3.21. 


Meses después se hizo una muestra aleatoria simple de 40 estudian- 
tes desertores y a partir de los datos obtenidos con la recopilación de in- 
formación, se les calculó una media aritmética de 9.11. Al ver que era más 
baja que el resto de la población, los directores se hicieron la siguiente pre- 
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gunta. ¿Es el número de visitas de los desertores significativamente más 
bajo que el de la población estudiantil? 


Supongamos la hipótesis de la investigación H,: X < u y la hipótesis 
nula Ho: x > 1, decidimos utilizar un nivel del 0.01 de significancia, la muestra, 
como vimos, es probabilística. 


Para probar la hipótesis calculamos el puntaje Z, normalizado como 
habíamos visto así: 


El signo es indiferente al resultado, porque estamos trabajando con 
áreas, por lo tanto Z = 5.86. 


En la tabla de áreas bajo la curva normal, vemos que para que el X sea 
significativamente distinto de u = 12.1, se necesita una Z = 2.33 o mayor; 
como el Z obtenido es mayor, se rechaza H, y se acepta H,, ya que: 


0.5000 - 0.0100 = 0.4900 
Entonces Z = 2.33 


Concluimos que los estudiantes desertores tienen un número de con- 
tactos significativamente inferior al resto de la población estudiantil. 


5.2.2 Distribución t de Student 


En los casos en que no se conoce el parámetro poblacional, depen- 
demos únicamente de las estadísticas de las muestras y utilizamos la 
Prueba t. 


Cuando n > 30 (muestra grande) la desviación estándar simbolizada por 
A, se le considera como un buen estimador de la desviación estándar 
poblacional, debido a que existe una mayor probabilidad de que los valores 
extremos que toma la variable, queden incluidos en el cálculo de la va- 
rianza para la muestra, tal como ocurre en el cálculo de la varianza pobla- 
cional. 


Siendo, 4 = S, la fórmula para obtener 4 será: 
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Para n < 30 (muestra pequeña) la desviación estándar se simboliza 
por 4, cuando no se ha efectuado ninguna corrección. Se considera que, 
A, por lo general, es mejor que S, debido a la menor probabilidad de que 
se incluyan los valores extremos de la variable. Por tanto, se hace nece- 
sario efectuar algunas correcciones en el cálculo: 


a. Cuando se da la desviación estándar sin corregir: 


b. Cuando se desea corregirla directamente 


3_[20-%* 


n-1 


En la distribución de t Student, se considera que las curvas son simé- 
tricas, pero algo más achatadas y más abiertas en los extremos, los cua- 
les corresponden a regiones críticas. A medida en que el tamaño de la 
muestra se hace más grande, más se acerca a la normal. 


La función dada para este tipo de distribución es: 


donde v corresponde a los grados de libertad, número que depende de 
n; Ces una constante que depende de v y es calculada en tal forma que el 
área bajo la curva sea igual a 1. 


Grados de libertad 
Corresponden al número máximo de variables que puedan asignarse 


lioremente, antes de que el resto de las variables queden completamente 
determinadas. 
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a) 


Las variantes estadísticas para el cálculo de t son: 


En las distribuciones muestrales donde n < 30, la fórmula es: 


X-p 
EA 
n-1 


t= 


también puede escribirse en la siguiente forma 


donde 4 se obtiene corrigiéndola así: 


no, yx - x) 
A A re 


En las distribuciones de medias muestrales se tiene: 


n,+n,-2 
A" De 


En la determinación de los puntos críticos, t, (inferior) y t, (superior), se 


utiliza la tabla t de Student. En primer lugar se fija el nivel de significación, 
por ejemplo, a. = 0.05, luego se calculan los grados de libertad, siendo en 
distribuciones muestrales v =n - 1, en diferencias de medidas muestrales: 
V= N;¡+ N, - 2. Si la prueba es bilateral, se tomará el 5% para cada una de 
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las regiones críticas y si es unilateral se tomará el doble del nivel de 
significancia asignado; en este caso, será 0. 1 0. 


Ejemplos: 

1. Una muestra de 25 observaciones tiene una media de 42.0 y una des- 
viación estándar de 8. Trabajando con un nivel de significancia del 1%. 
Existe razón para rechazar la hipótesis de que la media de la pobla- 
ción es de 46.0. 

a. H,: 1x7 46 
Ho: 1 =46 


b. a. =0.01 


-2.7969 2.7969 
Gráfica 12. 


2 alo. 1021, 8:17 
84757 ( ) 


V = 25-1; 0. = 0.01; corresponde a una t = 2.7969 
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Como el valor de t = -2.45 queda en la región de aceptación, se acepta 
la hipótesis de que u = 46, es decir no existe razón para rechazar que la 
media de la población es 46. 


2. Un fabricante de cigarrillos analiza el tabaco de dos marcas diferen- 
tes, para determinar el contenido de nicotina y obtiene los siguientes 
resultados, en miligramos. 


Marca A: 24 26 25 22 23 
MarcaB: 27 28 25 29 26 


¿Los resultados anteriores, señalan que existe una diferencia en el 
contenido medio de nicotina en ambas marcas? 


Solución: 

a) Hi: Mx 4 My 
Ho! x= My 

b) = 0.05 

C) Azy = 1 

Siendo 


Bey =|— 4 Á— 


Tabla 11. Resultado de las dos marcas de cigarrillos 
para determinar el contenido de nicotina 
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X= =24 Y =- 2 -=27 
10+10 P20 

A 

js! EU 

5-16 52-25 
25 25 

=== A bi 

decimo EE 


Re ZA Re t 
A 
— 2.3060 Critica a 2.3060 


f) Los resultados anteriores señalan que existe una diferencia significati- 
va en el contenido medio de nicotina en ambas marcas. Véase gráfica 
13. 


5.2.3 Distribución Chi Cuadrado: y? 


La distribución normal se utiliza en todos aquellos casos que ofrecen 
dos resultados posibles; cuando se presentan más de dos resultados posi- 
bles, debe aplicarse la prueba chi cuadrado que se simboliza así: x?. Un 
ejemplo típico de distribución lo constituye el lanzamiento de una moneda 
con posibilidades de que aparezca cara o sello. Uno de y? consiste en el 
lanzamiento de un dado con seis caras posibles, numeradas del 1 al 6. 
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El Chi cuadrado es la suma de las fracciones que tienen por numerador 
el cuadrado de las diferencias entre las frecuencias reales u observadas y 
las frecuencias esperadas o teóricas y por denominador la frecuencia es- 
perada. 
(n, - n 
Mea E AA 0 


en donde n, frecuencia observada o real 
n*; frecuencia teórica o esperada 


Se puede observar en la fórmula, que mientras mayor sea la coinciden- 
cia entre las frecuencias observadas y las esperadas, menor será el valor 
de x?. Si x? = 0 significa concordancia entre las frecuencias observadas y 
las esperadas. 


Ejemplo: 


Supongamos que se lanza un dado 60 veces. Se sabe que las fre- 
cuencias teóricas, para este caso son de 10 veces cada cara y las fre- 
cuencias reales son los resultados del lanzamiento. ¿La base de un nivel 
de significancia del 5%, permite suponer que el dado no es perfecto? 


Solución: 
El problema da las frecuencias reales nt, para cada cara, como se ve en 


la tabla 12. Las frecuencias esperadas se obtienen multiplicando la probabi- 
lidad de cada suceso por n (número de lanzamientos). Véase gráfica 14. 


Tabla 12. Frecuencia en el lanzamiento de un dado 60 veces 
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n'=np,= 60 l5 a =10 y así se obtienen las demás frecuencias teó- 


Se realiza la prueba teniendo en cuenta los siguientes pasos: 
1) H:n <n", 
HA, nt, 


2) a. = 0.05 


4) Van-1=6-1=5.. Xl00= 11.07 


ZA Re 
(€_E—— a 5 5 | 
11.07 
Gráfica 14. 


En la tabla de distribución de x?, encontramos que 11.07 es el valor 
crítico. 


5) < 0os , es decir 9 < 11.07, por lo tanto se acepta la hipótesis de que 
la diferencia no es significativa. En otras palabras podemos afirmar que 
a un nivel del 5%, las diferencias que presentan las frecuencias reales, 
con relación a las frecuencias teóricas no nos da base para afirmar que 
el dado está cargado. 
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PRUEBAS DE HIPÓTESIS - AUTOEVALUACIÓN N? 5 


¿La hipótesis de investigación es exactamente lo mismo que la 
hipótesis nula? 
Sí No 


Si una hipótesis de investigación es que dos poblaciones tienen 
iguales medias aritméticas, ¿cuál es la hipótesis nula? 


a. Que en efecto tienen iguales medias aritméticas 
b. Que las dos poblaciones tienen distintas medias aritméticas 
Cc. Que las medias aritméticas pueden ser iguales o distintas 


d. Para poder definirla hay que conocer la desviación estándar 


¿Una distribución de muestreo es lo mismo que una distribución 
de una muestra? 
Sí No 


¿Por qué? 


El nivel de significancia es: 
Lo mismo que el nivel de precisión 
La región crítica de una curva normal 
Una probabilidad 
El error alfa ol 


La exactitud con que se predicen los parámetros 


valor crítico de un puntaje Z para una prueba de una cola, al 
nivel de significancia 0.05 es: 
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¿A partir de una muestra de obreros en una fábrica, se puede 
inferir a cerca de las características de esa fábrica? 


No 

Sólo si uso una prueba Z 

Sólo si uso una prueba t 

Si se usa una prueba Z o prueba t 


¿La prueba t se prefiere a la prueba Z cuando no se conocen los 
parámetros del universo? 


Sí No 


Los salarios diarios de una industria están distribuidos normal- 
mente con una media de $132 y una desviación estándar de $25. 
Si una empresa de dicha industria, que cuenta con 40 obreros 
paga en promedio $122, puede acusarse a esta compañía de 
pagar salarios inferiores al nivel de significancia del 1%? 


SÍ No 


Desarrollo: 


Una hipótesis dice que el estudiante promedio de la universidad 
colombiana tiene un coeficiente de inteligencia mayor que el resto 
de la población. Escriba una hipótesis de investigación y una 
hipótesis nula, con un coeficiente de inteligencia que al estan- 
darizarse tiene una X = 100 


Hipótesis de investigación: 


Hipótesis nula: 


. Un fabricante de ciertas piezas de proyectiles sostiene que en 
condiciones normales de reparación, tienen una duración media 
u=320 horas. Probar esta afirmación frente a la alternativa 
u320, si 16 piezas duran un promedio de 308 horas, con una 
desviación de 29 horas. Utilizar un nivel de significancia del 5%. 


No, es lo contrario. 

b 

No. La distribución de una muestra son las características que 
tienen los datos a partir de una muestra. 

La distribución de un muestreo es la distribución de una mues- 
tra de medias a partir de muestras. 


Cc 
1.96 
d 
SÍ 
122-132 


EZA 


acusar a la compañía de pagar salarios inferiores al nivel del 1% 


=-2.53 cae en la región de rechazo. Se puede 


Hipótesis de investigación: H,=X >100 Hipótesis nula: H,=x<100 


_ 308 - 320 
29/15 


la duración promedio es de 320, a un nivel significativo del 5%. 


=71.60 cae en la zona de aceptación, o sea, que 


10.1 


. Sí, porque yx? = 4.518 y cae en la zona de aceptación y se puede 
considerar el dado perfecto. 
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6. REGRESIÓN Y CORRELACIÓN 


6.1 Introducción a la bidimensional 


En esta parte examinaremos la relación entre variables, medidas en es- 
calas de intervalo o de razón. Pero ya no sólo queremos comparar, ahora 
queremos entender qué tipo de conexión hay entre las variables, por inter- 
medio de la relación que existe entre ellas, e ir más allá entendiendo la 
naturaleza de la relación entre las variables. 


En las distribuciones bidimensionales se consideran dos variables en 
forma simultánea, determinándose si tienen alguna relación funcional entre 
sí; aún más, cuantificando dicha relación. Estas variables pueden ser am- 
bas discretas, ambas continuas, o una discreta y otra continua. 


Llamaremos Xi a la primera variable, donde i toma todos los valores 
desde 1 hasta n. Así tendremos X;, X,, Xz, ... X,; Y, se considerará como la 
segunda variable, donde ¡ toma los valores desde 1 hasta n. Se tendrán 
tantos valores de X como valores de Y, es decir, se tomarán siempre pares 
de observaciones. 


Tabla. Valores de X y Y 


Para cada variable se podrá calcular la media aritmética, la varianza y 
la desviación estándar, usando los datos no agrupados. 


x_ 2% _ 110 1833 
N 6 
y. A O er 
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LX _ze_ 2550 _ 18.33) _ 89.01 


S? = 
n 5 


s_ 24 _y_ 1182 _ (41 66) _ 61.04 


S > VS? = 189.01 = 9.44 
S,= VS = y/61.04 = 7.81 


La covarianza es una medida de dispersión que representa el grado de 
variabilidad conjunta entre X; y Y, Su símbolo es m,, ó m,,. Se define como 
la media del producto de las desviaciones respecto a las medias aritméti- 
cas. Entonces se puede calcular la covarianza por la siguiente fórmula: 


LXY x.y 
n 


m 
xy 


Tomando los datos de la tabla anterior podemos calcular la covarianza 
así: 


m,- 2/2 _ - (18.33)(11.67) 
á 6 


m,, = 286.83 — 213.91 


xy — 


m,,= 72.92 


xy — 


Los datos de la distribución bidimensional anteriormente dada puede 
representarse gráficamente en un par de ejes de coordenadas, tomando 
el eje de la abscisas para la primera variable (X;) y el eje vertical para los 
valores de la segunda variable (Y). 
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En un plano cartesiano se presentan tantos datos como puntos pares 
de observaciones se tengan, correspondiendo cada punto a un par de ob- 
servaciones. A esta representación gráfica se le denomina indistintamen- 
te diagrama de desparramiento, de esparcimiento o nube de puntos. 


Gráfica 15. Nube de puntos 
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Xx 


El problema consiste ahora en unir varios puntos de ese conjunto o 
nube de puntos, mediante un ajuste, ya sea rectilíneo, parabólico, expo- 
nencial o de cualquier otro tipo de línea que represente al conjunto. En 
algunos casos esos puntos estarán condensados al rededor de la línea, 
en otros presentarán diferencias; en este último caso, se pueden producir 
grandes errores, como consecuencia de que el ajuste realizado no es el 
más indicado. 


El tipo de línea que se relaciona, dependerá de la forma que asuma el 
conjunto de puntos, al hacer la respectiva gráfica. También valiéndose de la 
experiencia del estadístico se puede determinar el mejor ajuste. En la 
exponencial, es muy sencilla la identificación, basta que la variable muestre 
un crecimiento geométrico, como por ejemplo, la población, el producto bruto, 
etc. 


En general, se dice que la curva que hace mínima la suma de los cua- 
drados de las desviaciones entre puntos dados, dicha línea es la mejor. 


MÓDULO 4: ANÁLISIS DE LA INFORMACIÓN 101 


6.2 Ajuste de una recta de regresión rectilíneo simple 


Supóngase que se desea ajustar una recta, para ello sabemos que la 
ecuación general de la recta es: 


Y =a+bx, X=a+by 


donde X, en la primera ecuación y Y en la segunda es la variable que 
se supone conocida, llamada variable independiente. Ahora, Y y X en una 
segunda ecuación corresponde a la variable que se va a estimar, conoci- 
da con el nombre de variable dependiente. 


a. esel coeficiente de posición, denominado también origen, o sea, es 
la altura de la perpendicular levantada en el punto de origen. Véase gráfica 
16. 


El coeficiente de posición puede ser mayor, menor o igual a cero. 


a) a>0 b) a=0 c) a<0 
| Y 
X X 
o 0 X 
Gráfica 16. 


En el primer caso será un punto por encima del origen, en el segundo 
pasará por el origen y en el tercero estará por debajo del origen. 


b. Es el coeficiente angular, el cual nos determina los crecimientos o 
la cantidad que aumenta en Y, por cada unidad que aumenta X y se deno- 
mina como pendiente. 


El coeficiente angular puede ser: 
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a) b>0 b) b<0 c) b<0 


Y NN 
X X 
0 0 ds 0 


Gráfica 17. Coeficiente angular b. 


Gráfica 18. Posición de a y b. 


Si b es un valor mayor que cero, es decir positivo, nos indicará que la 
recta es ascendente; si b es menor que cero, la recta será descendente y 
si es igual a cero, la recta es paralela al eje horizontal o vertical. 


Cuando se tiene la ecuación Y = a + bx, se dice en este caso que se 
está estimando a Y en función de X. Para la ecuación X = a + by, decimos 
que estimamos a X en función de Y 

El problema, ahora, consiste en calcular los parámetros a y b. 


Partiendo de las ecuaciones normales de los mínimos cuadrados, se 
pueden calcular estos parámetros. 
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Las ecuaciones normales para los mínimos cuadrados son: 


1) EY = Na + bEX 
2) EXY = aEx + bEX? 


Tomaremos los datos de la distribución bidimensional de la tabla y reem- 
plazando en estas ecuaciones se tiene: 


1) 70=6a+ 110b 
2) 1.721 =110a + 2.550b 


Por sustitución, eliminamos a y calculamos el valor de b así, multipli- 
camos los valores de la ecuación (1) por -110 y los de la ecuación (2) por 
6 y se resta de la primera. 

1) -7.700 = -660a - 12.100b 


2) 10.326 = 660a + 15.300b 


2.626 = 3.200b 
3.200 


Reemplazamos el valor calculado de b en la ecuación (1) así: 


1) 70 = 6a+110(0.82) 


70 = 6a + 90.2 
70-—90.2 
a = ——— 
6 
a = -3.37 


Reemplazando en la ecuación general de la recta, Y = a + bx, se tiene: 
Y = 3.37 + 0.82x 


cuando se quiere estimar X en función de Y, se procede de la siguiente 
forma: 


X=a+by 
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Las ecuaciones normales para el cálculo de los parámetros a y b son: 
1) EX = Na + bEY 

2) EXY.= aL Y + bEY? 

1) 110=6a+70b 

2) 1.721 = 70a + 1.128b 

Multiplicando (1) por -70 y (2) por 6 y luego restamos de la primera: 
1) -7.700 = -420a - 4.900b 


2) 10.326 = 420a + 7.092b 


2.626 =.2.192b 
_ 2.626 - 120 
2,192 


Reemplazando este valor en la ecuación (1) se tiene el valor de a 
1) 110 = 6a+70(1.20) 


110 = 6a+84 


100 — 84 
6 
100 — 84 
6 


Reemplazando en la ecuación general de la recta X = a + by, se tiene: 
X = 4.33 + 1.20y 
6.3 Correlación 
En la práctica algunas de las variables que medimos en los procesos de 
investigación, tienen un nivel de medición intervalo o de razón y para re- 


solver problemas con estos niveles existen unas técnicas diferentes a las 
que hasta ahora hemos visto. 
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Cuando tenemos mediciones realizadas con escalas intervalos o de 
razón, la mejor medida paramétrica de asociación es la relación de Pearson 
(r), también conocida como la relación Producto-Momento. Para hacer 
una correcta interpretación del coeficiente, se tienen que hacer dos supo- 
siciones. 


1. Se supone que la relación es lineal. 
2. Que la distribución de las variables asociadas tiende a ser normal. 


Es importante entender que una correlación entre dos variables produce 
un número que resume la naturaleza de la asociación entre las variables. 


En el caso de la correlación de Pearson, ese número (r) toma valores 
desde -1 hasta +1, pasando por cero, cuando hay relación entre las varia- 
bles. Si la relación tiende a ser inversa, se aproximará a -1, en la medida 
en que sea perfecta y por el otro lado, si la correlación tiende a ser directa, 
se acercará a +1. No sólo sirve para indicar si hay o no relación, sino para 
indicar la fuerza de la misma y también para compararla con las otras 
variables. 


Una forma adecuada para ilustrar la naturaleza de r, se muestra en la 
figura 19. Aquí se presentan 6 tipos de relaciones entre las dos variables X 
y Y. Cada punto en los cuadrantes representa los valores de X, y Y toma 
un elemento de la muestra o población analizada. 


En la gráfica A, se ve claramente una nube de puntos dispersos, casi 
que aleatoriamente distribuidos. Cuando esto sucede no existe ninguna 
relación directa entre las dos variables, es decir r es igual o tiende a cero 
(r = 0). 


En la gráfica B, vemos que existe una tendencia. A mayores valores de 
X parecen estar asociados mayores valores de Y, por lo tanto, existe una 
relación directa entre las dos variables. Es decir r>0. 


En la gráfica C, vemos que también hay una tendencia, pero en este 
caso indicando que a valores pequeños de X corresponden valores gran- 
des de Y y a valores grandes de X corresponden valores pequeños de Y. O 
sea, hay una relación inversa entre las dos variables r<0. 


En la gráfica D, vemos que hay una correlación no lineal entre las dos 
variables. En el rango de valores bajos y altos de X corresponden valores 
bajos de Y y en el rango de valores intermedios de X corresponden valores 
altos de Y. Aunque r = 0, no podemos decir que no hay relación entre las 
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dos variables, sólo que la relación es curvilínea y por lo tanto requiere de 
un tratamiento particular. 
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Gráfica 19. Ejemplos para entender la interpretación de r. 


Los dos últimos gráficos E y F sirven para ilustrar una situación que 
suele presentarse durante una investigación. 


En el caso E, vemos que la mayoría de los elementos analizados, pa- 
recen indicar la no existencia de relación entre las dos variables, pero hay 
unos pocos casos donde altos valores de X tienen a los valores de Y. 


En el caso F, se presenta lo contrario, la mayoría de las observaciones 
analizadas indican una relación positiva entre X y Y, pero unos pocos ca- 
sos la distorsionan, ya que rompen la tendencia. 


Estos ejemplos, muestran la utilidad de hacer uso de histogramas y de 
las distribuciones de las frecuencias obtenidas, para no cometer errores. 
Por ejemplo, concluir que no hay relación en el caso del gráfico D, cuando 
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en realidad hay una no lineal; o decir que hay relación positiva en el gráfico 
E, o que no existe relación en el gráfico D, cuando en realidad es lo con- 
trario. 


En estos dos últimos casos, lo recomendable es retirar los elementos 
distorsionadores, o completar una mayor información, por si en realidad lo 
sugerido por los casos extremos es la tendencia real, o por último, revisar 
los procesos de recolección, codificación o sistematización de la informa- 
ción, donde se pudo haber cometido algún error. 


6.4 Coeficiente de correlación 


Nos permite cuantificar el grado de correlación existente entre las va- 
riables X y Y. 


Hay dos maneras de calcular el coeficiente de correlación, una aritmé- 
tica y otra por medio de álgebra de matrices. 


Hagamos un ejercicio aritmético: 
Supongamos que queremos medir la asociación que existe entre inno- 
vación tecnológica y producción, en 11 empresas que elaboraron un mis- 


mo producto. En la tabla 12 se presenta la información obtenida en visitas 
realizadas a 11 industrias. 


Tabla 12. Ejemplo para calcular r 


Nivel da 
tecnológico X 


4 
2 
3 
4 
5 
6 
7 
8 
9 
0 
1 


== — 


Y=194 X?*=26.706 | Y?=3.520 | XY = 9.531 
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Una fórmula para calcular r es: 


— NEXY-2XEN 
[NEX? — (INE Y? - (EY7] 


Sustituyendo tenemos: 


Ñ (11)(9.531) - (516)(194) 
-J1(26.706)-(516)2][11(3.520)-(194)7 


4.737 


/ 29.820.840 


Fes 0,867 


r 


r 


Como correlaciones cercanas a 1 son altas e indican una asociación 


positiva, concluimos que hay una alta asociación entre la tecnología utili- 
zada y la producción en el tipo de industria estudiadas. 


El grado de correlación lo podemos clasificar evitando un tanto la rigi- 


dez de sus límites: 


a. 


b. 


Correlación perfecta, cuando r=1 (o menos de 1). 


Correlación excelente, cuando r es mayor que 0.90 y menor que 1, ó 
(-1<Y<-0.90). 


Correlación aceptable, cuando r se encuentra entre 0.80 y 0.90 
ó (-O90<r<-080). 


Correlación regular, cuando r se encuentra entre 
0.60 y 0.80 (-080<r<-0.60). 


Correlación mínima, cuando r se encuentra entre 0.30 y 0.60 
(-0.60<r<-0.30). 


No hay correlación para r menor de 0.30 ó (-0.30<r<0) 
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REGRESIÓN Y CORRELACIÓN - AUTOEVALUACIÓN N? 6 


. La fórmula Y = a + bx, ¿corresponde a la ecuación general de la 
recta? 


Sí No 


¿Qué nombre recibe la variable X? 


. ¿Quénombre recibe a? 


. ¿Quénombre recibe b? 


. Con base en los datos de la siguiente tabla de valores para X y Y, 
halle la recta de regresión por los mínimos cuadrados. Para 
Y=a+bx 


5. Calcule el coeficiente de correlación, a partir de los datos de la 
siguiente tabla: 


. Sí. Variable independiente. 
. Coeficiente de posición. 

. Coeficiente angular. 

. Y =-180.4 + 15.7x 


.r=0.60 
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7. ANÁLISIS DE LA VARIANZA 


Del análisis de varianza, podemos decir que esta técnica estadística, 
normalmente es utilizada para analizar resultados en la investigación con 
diseños experimentales y cuasi experimentales. Muchas veces necesita- 
mos comparar dos o más distribuciones, que corresponden a variaciones 
de una misma variable dependiente, afectada por una o más variables 
independientes. 


Las variables independientes pueden ser medidas en cualquier tipo de 
escala, pero la variable dependiente debe ser medida, al menos, al nivel 
intervalo. Si las variables independientes son medidas al nivel intervalo o 
de razón, tendríamos un típico caso de análisis de regresión múltiple. 


Si queremos medir la importancia relativa de tres procesos en la cali- 
dad de un producto final utilizamos el análisis de varianza (ANOVA). 


En la tabla 13 tomamos unos datos hipotéticos para ilustrar su caso. Te- 
nemos tres grupos de 5 productos, seleccionados independientemente, 
al azar, con sus respectivos puntajes, en cuanto a su calidad; ésta, que 
es la variable dependiente, se midió por medio de una escala intervalo. 


Tabla 13. Datos para ilustrar el uso de Anova 


Supongamos que cada grupo sometido a un método de producción 
distinto, tiene varianzas iguales. Es decir, la hipótesis nula H,, es que no 


112 SERIE: APRENDER A INVESTIGAR 


hay diferencias en las medias aritméticas de los tres grupos. Suponga- 
mos que queremos analizar las observaciones a un nivel de significancia 
del 0.05 y ver si hay diferencias en la calidad por el método empleado. El 
cálculo de F, contra cuya distribución de muestreo se comparan los resul- 
tados, es el procedimiento a seguir. 


1? Suma total de los cuadrados de los puntajes de los tres grupos así: 


E0—ry - me - 220 


2 
- (482 + 283 + 158) — — 


= 923- 821.4 = 101.6 


2” Suma de cuadrados entre columnas. Igual fórmula pero referida a cada 
uno de los tres grupos o métodos utilizados así: 


= 482 — 460.8 - 21.2 


Método 1 = 482 — E 


Método 2 = 283 — a. = 283 —- 273.8 = 9.2 


15h, = 158 — 1350 22 


Total 53.2 


Método 3 = 158 — 


3” Suma de cuadrados entre columnas (grupos). 
Suma total del cuadrado = suma “dentro” + suma “entre” 
Suma “entre” = suma total - suma “dentro”. 
Suma “entre” = 101.6 - 53.2 


Suma “entre” = 48.4 
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4 Grados de libertad. Son los siguientes: 
Suma total = n-1 
= 15-1=14 


Suma “dentro” = K(N,-1); donde K=número de grupos y N, 
tamaño de los grupos (5) 


= 3(5-1) 
=12 
Suma “entre” = K-1 
= 3-1 
=2 
5 Cálculo para análisis de la varianza con el valor de F 
e Md ra 
Cuadrados | libertad | de la varianza 
Total 


Entre columnas 


Dentro de las 
columnas 


La estimación de la varianza es la razón de la suma de cuadrados y 
los grados de libertad y F es igual a la razón de la estimación “entre” y la 
estimación “dentro”. 


48.4 
Varianza “entre”. = _ = 24.2 
A 
4.43 
53.2 
Varianza “dentro” = = 4.43 


12 
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6% Decisión 


En la tabla de distribución F vemos que con un nivel de significancia 
del 0.05 y con 2 y 12 grados de libertad, necesitamos un valor igual o ma- 
yor a 3.88 para poder rechazar H,. Como en efecto obtuvimos uno de 5.46, 
rechazamos H, y concluimos que los métodos utilizados sí producen una 
diferencia significativa en la calidad del producto. 


ANÁLISIS DE VARIANZA - AUTOEVALUACIÓN N? 7 


1. En una universidad se quiere probar el efecto que distintos méto- 
dos de enseñanza tienen, en los resultados de un curso dado. 
Tres métodos se proponen y se aplican a tres grupos, compues- 
tos de 14 estudiantes, cada grupo seleccionado aleatoriamente 
entre los alumnos del curso. Los resultados del examen final del 
semestre se presentan a continuación. Se puede concluir que los 
métodos producen un efecto diferencia. 


2. La distribución que se utiliza para probar el nivel de significancia 
de un análisis de varianza es el y? 


Verdadero Falso 


. Suma total = 5.112.4 

. Suma de cuadrados entre columnas: 
Método 1 = 1.309.4 
Método 2 = 675.5 


Método 3 = 715.4 


Total 2.700.3 


. Suma de cuadrados entre columnas. 
Suma de cuadrados entre las columnas: 
5.112.4 
2.700.3 
2.412.1 
. Grados de libertad. 
Suma total = 42-1 =41 
Suma dentro  =3(14 - 1)39 
Suma entre = 3-1 =2 
. Cálculo F 


Sumade Grados de Varianza 
cuadrados libertad 


Total 5.112.40 41 
Entre 2.412.10 2 1.206.10 


Dentro 2.700.30 39 69.24 


¿oN NOIOVNTIVAJOLNV VI V VLSINASI38Y 
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Si se prueba con significancia del 0.01, esto implica que necesi- 
tamos un F al menos de 5.3, para rechazar H, y aceptar que los 
métodos sí tienen efecto en el rendimiento académico de los es- 
tudiantes y como se obtiene un F=17.42, concluimos que sí tiene 
efectos. 


2. Falso, es la distribución F. 


Comente los resultados de los 2 problemas. 


UVOLLSIANI V YION3IYAV :3143S 9!! 
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8. ESTUDIO DE FACTIBILIDAD DEL SOFTWARE 
ESTADISTICO 


La necesidad de contar con una herramienta adecuada para la ense- 
ñanza e investigación estadística, conlleva a realizar un estudio detallado 
de los programas con mayor aplicación en estos campos, además se 
debe considerar para la implementación de éstos, los recursos físicos 
para un desempeño eficaz. 


El paquete estadístico SAS y SPSS cumplen con los requerimientos 
académicos debido a su manejo personalizado, cursos de actualización y 
asesoría continua, lo cual contribuye como soporte a la docencia y en 
gran parte al proceso educativo. 


8.1 SAS 


Es un sistema que provee herramientas para la captura, administra- 
ción y análisis de datos. 


+ Este software permite un total control sobre la información. 

+. Permite accesar, administrar, analizar y presentar la información. 
+ ElSAS está conformado por los siguientes módulos: 

STAT 


Provee herramientas para el análisis estadístico avanzado. Sirve para 
administrar la información como: 


Almacenamiento y recuperación de información. 


Programación y modificación de datos. 


Reportes. 


Análisis estadístico. 
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SAS/STAR PROCEDURES | 


2-22 


Regression Analysis Multivariante Survial Clustering Scoring Categorical Discriminant 
NLIN Orvenanes CANCORR Analysis ACLACUS CADMOD CANDISC 
ANOVA- SCORE 
ORTHOREG PLAN- FACTOR LIFEREG CLUSTER- FREQ DISCRIM 
REG-RSREG TTEST PRINCOMP FASTCLUS STEPDISC 
on TREE- 
NESTED- 
VARCOMP VARCLUS 
ESP** 


Sirve para construir y manipular conjuntos de datos. Este módulo facilita 
la captura de datos, validación, verificación en tablas, edición y consulta. 


AF** 
Sirve para crear menús y para encadenar los diversos módulos. 


ETS* 

Provee herramientas para realizar proyecciones en modelos economé- 
tricos. Puede realizar reportes como tablas de amortización y tablas de 
depreciación. 

OR 

Provee una herramienta para investigación de operaciones. 
Qc* 

Es una aplicación para estadísticas en control de calidad. 


GRAPH 


Es el módulo que posee el SAS 


Convenciones: 
* No es necesario. 
* Para realizar aplicaciones bajo ambientes SAS. 
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SHARE 


Permite el acceso concurrente de varios usuarios a archivos comunes 
SAS. Este módulo garantiza la integridad y la seguridad de la información. 


ACCES 

Este módulo sirve para realizar las interfaces en los manejadores de 
bases de datos. 
8.2 SPSS 
BASE 

Contiene estadísticas básicas, gráficos de alta resolución y un paque- 
te completo de listado. Con el SPSS BASE 6.0 bajo Windows se produci- 
rá un análisis y resultados de alta calidad. 
— Estadísticas profesionales 

Medidas de similariedad y diferencias en sus datos, provee técnicas 
de clasificación. En este procedimiento incluye Análisis Cluster, Análisis 
Discriminante, Análisis Factor, Análisis Multidimensional, Análisis Proxi- 
midades, Mínimos Cuadrados con Ponderación y Mínimos Cuadrados con 
dos fases. 
— Estadísticas avanzadas 

Incluye sofisticadas técnicas como: Regresión Decox, Estimación 
Kalpian Meier, Regresión Logística, Análisis Lineal Logarítmico, Análisis 
de Varianza Multivariado, Regresión No-Lineal de Vida (Tabla vida). 


— Tablas 


Crea una variedad de cuadros tabulares, incluyendo tablas complejas 
(múltiple respuesta). 


— Tendencias 


Ejecuta pronósticos y análisis de series de tiempo, modelos de suaviza- 
ción y métodos para estimación autorregresión. 
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— Categorías 


Ejecuta análisis conjunto y procedimientos de optimización, incluyen- 
do análisis de correspondencia. 


— Chaid 
Desarrolla modelos predictivos, produce variables predictorias. 
— Lissrel 
Relaciona un análisis estructural lineal y modelos de ecuaciones simul- 
táneas. 
8.3 Requerimientos mínimos para la instalación del Software SAS 
1. Procesador 486 o superior. 
2. Memoria RAM 32 Mb o superior. 
3. 20 Mb de espacio en el disco duro. 
4. Cualquiera de las siguientes opciones 
+ Windows versión 3.1 o posteriores. 
+ Windows para trabajo en grupo versión 3.1 o posteriores. 
8.4 Requerimientos mínimos para la instalación del Software SPSS 
1. Procesador 386 o superior. 
2. Memoria RAM 32 Mb o superior. 
3. 20 Mb como mínimo para almacenar el SPSS. 
4. Monitor VGA. 
5. Cualquiera de las siguientes opciones. 
6. Windows versión 3.1 o posteriores. 


+ Windows para trabajo en grupo versión 3.1 o posteriores. 
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8.5 Manejador de Base de Datos 


En la actualidad existen en el mercado una gran variedad de maneja- 
dores de bases de datos con características únicas, es decir, no son com- 
patibles con los sistemas tradicionales de manejadores de bases de datos 
de segunda y tercera generación como Dbase, DataEase, Foxpro. Los 
manejadores de Bases de Datos de cuarta generación que se recomien- 
dan por compatibilidad son Acces, Paradox, Foxpro. 


Para cumplir con los objetivos educativos se recomienda por su flexi- 
bilidad y compatibilidad el Foxplus bajo ambiente Windows. 


Visual Foxpro 6.0 


La herramienta para el desarrollador profesional de aplicaciones xBase. 
(En esta nueva versión obtendrá: Mejor rendimiento e IDE, mayor conec- 
tividad y soporte de ActiveX). 


Características 


Sigue la evolución de Foxpro desde un sistema de desarrollo de bases 
de datos de escritorio y de tipo procedural a un entorno de desarrollo 
orientado a objetos, con las herramientas necesarias para construir apli- 
caciones y componentes en sistemas clientelservidor e Internet. 


Visual Foxpro 6.0 es un miembro de la familia que integra el sistema de 
desarrollo Visual Studio. Permite la utilización de los últimos avances en los 
sistemas operativos Windows y Windows NT y ha sido diseñado para per- 
mitir a los 500.000 desarrolladores que usan Visual Foxpro una forma más 
potente y eficiente de crear aplicaciones multicapa cliente/servidor, basa- 
das en Web y centradas en el tratamiento de datos. La compatibilidad con 
el año 2000 está totalmente asegurada. 


Visual Foxpro mantiene un completo set de comandos Xbase para per- 
mitir una curva suave de aprendizaje a los programadores de bases de 
datos en entornos MsDos. 


Dispone de las características más avanzadas en el diseño de clases 
orientadas a objeto incluyendo herencia, subclases, encapsulación y poli- 
morfismo. Las librerías de clases visuales y no visuales (por código) redu- 
cen enormente el tiempo de desarrollo. 
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Existen herramientas de diseño para todas las fases de desarrollo de 
la aplicación. Un motor de bases de datos altamente eficiente, un lenguaje 
centrado en los datos y la capacidad de creación de componentes hacen 
de Visual Fospro una herramienta idónea para la generación de lógica de 
negocio en los entornos multicapa con tratamientos intensivos de datos. 


Visual Foxpro puede intercambiar datos con bases de datos SQL a 
través de ODBC (Open Database Connectivity). De esta forma, no es 
necesario un gran esfuerzo en la adaptación de aplicaciones basadas en 
servidor de ficheros a aplicaciones clientelservidor. También podemos uti- 
lizar los componentes ADO (ActiveX Data Objects) para intercambiar in- 
formación con datos relacionases y no-relacionales mediante OLE DB. 


Visual Foxpro puede ser utilizado en las tres capas de una arquitectura 
clientelservidor. Puede suministrar el interface de usuario a través del uso 
de formularios con toda la potencia de la orientación a objeto. Los controles 
ActiveX pueden usarse en los formularios y se subciasean para extender 
sus funcionalidades. La lógica de negocio puede encapsularse en compo- 
nentes muy eficientes gracias a la potencia de Fospro en la recuperación y 
manipulación de datos. Los componentes COM pueden ser llamados des- 
de el front-end del usuario o desde el servidor Internet. Los componentes 
comunican con las bases de datos de Fospro y SQL a través de ODBC y 
OLE DB. En almacenamiento de datos puede estar soportado por el motor 
de Visual Foxpro. En arquitecturas CIS la mejor combinación es SQL para 
el proceso de las transacciones y Visual Foxpro para el manejo de consul- 
tas locales y procesos batch. 


Novedades en Visual Foxpro 6.0 


La aparición de Visual Foxpro 6.0 ha supuesto principalmente una evo- 
lución de las herramientas de desarrollo para adaptarlas a la arquitectura 
COM y al desarrollo de aplicaciones multicapa en Internet e Intranet. Ade- 
más dispone de herramientas de desarrollo mejoradas y ampliadas. Por 
último se han revisado los comandos de programación, destacando la 
mejora en el soporte del año 2000. 


Las principales novedades son: 
OLE Drag and Drop 

El OLE Drag and Drop permite intercambiar datos entre los controles de 
una aplicación o entre varias aplicaciones que soporten esta funcionalidad. 


Ahora podemos arrastrar ficheros desde el explorador de Windows a la 
ventana del proyecto o transportar textos con el ratón desde Word o Excel. 
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Visual foxpro disponía desde versiones anteriores de un drag and drop 
propietario. Sigue existiendo, pero se recomienda no utilizar los dos tipos 
de drag and drop simultáneamente en una aplicación. 


Documentos activos 


Visual Foxpro permite crear documentos activos, los cuales permiten 
visualizar documentos no-Htmi en un explorador de Internet. De momento 
sólo es posible con el Microsoft Internet Explorer. Un documento activo es 
un tipo de documento OLE embebido. Se visualiza totalmente en un área 
de la aplicación contenedora o host, mezclando su menú con el del host. 
La tecnología de documento activo permite visualizar múltiples tipos de 
documentos dentro de un único contenedor. 


A diferencia de Visual Basic, los formularios de Visual Foxpro no re- 
quieren modificaciones para crear documentos activos. Es suficiente con 
iniciar la aplicación desde una clase basada en la clase base ActiveDoc. 
La clase base ActiveDoc aporta las propiedades, eventos y métodos para 
un documento activo y de esta forma interactuar con el host. 


Mejoras en el servidor de automatización 


Un servidor de automatización es un componente que expone su 
funcionalidad, la cual puede ser usada por otras aplicaciones a través de 
la automatización. Visual Foxpro puede crear servidores de automatización 
dentro o fuera del proceso. 


Las mejoras en este tema se refieren al soport del Apartement Model 
Threading. De esta forma Visual Foxpro tiene soporte para Microsoft Tran- 
saction Server. Los componentes construidos con Visual Foxpro pueden 
ser manejados por el explorador de Microsoft Transacción Server y parti- 
cipar en las transacciones con otros componentes. 


Otras mejoras de adaptación de los servidores de automatización a la 
arquitectura COM son: gestión optimizada del Runtime, soporte mejorado 
de las librerías de tipos, manejo de excepciones, paso de arrays, nuevas 
propiedades y métodos para la automatización... 


Galería de componentes 
La galería de componentes es una nueva herramienta que ayuda a agru- 


par y organizar objetos como las clases, librerías, formularios, botones. 
Los distintos objetos pueden organizarse en otros objetos como proyectos, 
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aplicaciones u otras agrupaciones diferentes. Estas agrupaciones visua- 
les se pueden adaptar dinámicamente a las necesidades del desarrollador. 


La galería de componentes incluye también las Visual Foxpro Foun- 
dation Classes. Son un conjunto de clases para mejorar las aplicaciones, 
reutilizando código probado y optimizado. 


Estas clases pueden incluirse en nuestros proyectos directamente o 
crear subciases para adaptarlas a las distintas aplicaciones. 


Aplicación de cobertura y control de rendimiento de código 


La aplicación de cobertura genera información de las líneas que fueron 
ejecutadas en un determinado fichero. Por otro lado se puede configurar 
el control que se realiza sobre las líneas de código ejecutadas, cuántas 
veces se ejecutan, duración y muchos otros aspectos. 


Acceso por programa al proyecto 


En versiones anteriores de Visual Foxpro, el único acceso a los pro- 
yectos se realizaba de forma directa, abriendo la tabla pix a través del 
gestor de proyectos. Ahora se ha implementado un objeto proyecto para 
poder manipularlo por programa. El objeto proyecto actúa de intermedio 
entre un proyecto abierto y el desarrollador que puede interactuar direc- 
tamente con el proyecto. 
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9. 


STATGRAPHICS 


Software para el análisis de datos cuantitativos y cualitativos cuya es- 


tructura está sobre la base de menús. Existen versiones para trabajar bajo 
DOS y bajo Windows. 


El menú principal de Statgraphics permite entrar a cualquiera de las 22 


secciones divididas en seis grupos. 


9.1 Grupo l: Data handling and system utilities 


A. 


DATA MANAGEMENT. Menú para entrada de datos, definición de varia- 
bles, importación y exportación de datos. 


SYSTEM ENVIROMANT. Acceso a requerimientos y configuración del 
sistema. 


. REPORT WRITER AND GRAPHICS REPLAY. Configuración de im- 


presoras. 


. PLOTTER INTERFACE. Interfase para plotter. 


9.2 Grupo Il: Plotting and descriptiva statistics 


E: 


PLOTTING FUNCTIONS. Elaboración de gráficas estadísticas en dos 
y tres dimensiones. 


DESCRIPTIVE METHODS. Resume datos, realiza distribuciones de 
frecuencia, obtiene estadísticas básicas. 


. ESTIMATION AND TEST. Elabora intervalos de confianza y pruebas de 


hipótesis para una o dos muestras. Permite hacer pruebas de bondad 
de ajuste. 


DISTRIBUTION FUNCTIONS. Genera números aleatorios. Permite ha- 
cer cálculos con las principales funciones de probabilidad continuas y 
discretas. 


EXPLORATOR Y DATA ANALYSIS. Realiza el análisis exploratorio de 
datos, diagrama de tallos y hojas, diagrama de caja, etc. 
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9.3 Grupo lll: Anova and regression analysis 

J. ANALYSIS OF VARIANCE. Realiza análisis de varianza de una o dos vías. 

K. REGRESION ANALYSIS. Ajusta modelos lineales y no lineales en una 
y varias variables. 

9.4 Grupo IV: Time series procedures 

L. FORECASTING. Pronosticación con modelos de series temporales. 

. SMOOTHING. Procedimientos de promedios móviles 


. QUALITY CONTROL. Procedimientos de control de calidad estadísticos. 


OZ 


. TIME SERIES ANALYSIS. Procedimientos para ajustar modelos ARIMA 
a series temporales. 


9.5 Grupo V: Advanced procedures 


P. CATEGORICAL DATA ANALYSIS. Tablas de contingencia, correspon- 
dencias simples, etc. 


Q. MULTIVARIATE METHODS. Componentes principales, análisis de con- 
glomerados, tests multivariados, etc. 


R. NONPARAMETRIC METHODS. Pruebas no paramétricas con una y 
varias muestras. 


S. SAMPLING. Determina tamaño de la muestra. 


T. EXPERIMENTAL DESIGN. Métodos de diseño de experimentos, anova, 
manova, diseños 2*?, 2*, etc. 


9.6 Grupo VI: Mathematical procedures 


U. NUMERICAL ANALYSIS. Métodos de análisis numéricos, raíces de fun- 
ciones, método simple, álgebra, etc. 


V. MATHEMATICAL FUNCTIONS. Glosario de funciones matemáticas, 
aplicaciones. 
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9.7 Requerimientos físicos para la instalación de Statgraphics 


1. Sistema operativo DOS (Windows 3.1 o superior si se va a instalar la 
versión bajo Windows). 


2. Procesador 386 o superior 
3. El monitor se configura en la instalación. 


4. 5 Mb para almacenar el STATGRAPHICS. 
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Tablas 


Áreas bajo la curva normal 


Fracción del área total (10.000) bajo la curva normal, correspondiente a dis- 
tancias entre la media y las ordenadas situadas a z unidades de desviación 
estándar de la media. 


z %6 07 08 0.9 
00 0000 0040 0089 0120 0199 0239 0279 0319 0359 
0.1 0398 0438 0478 0517 0595 0636 0675 0714 0753 
0.2 0793 0832 0871 0910 0987 1026 1064 1103 1141 
0.3 1179 1217 1255 1293 1368 1406 1443 1480 1517 
0.4 1554 1591 1628 1664 1700 1736 1772 1808 1844 1879 
0.5 1915 1950 1985 | 2019 2054 2088 2123 2157 2190 2224 
06 2257 2291 2324 2357 2389 2422 2454 2486 2518 2549 
0.7 2580 2612 2642 2673 2704 2734 2754 2794 2823 2852 
08 2881 2910 2939 2967 2995 3023 3051 3078 3106 3133 
0.9 3159 3186 3212 3238 3264 3289 3315 3340 3365 3389 
10 3413 3438 3461 3485 3508 3531 3594 3577 3599 3621 
1,1 3643 3665 3686 3718 3729 3749 3770 3790 3810 3830 
1,2 38949 3869 3888 | 3907 3925 3944 3962 3980 3997 4015 
13 4032 4049 : 4066 4083 4099 4115 4131 4147 4162 4177 
1.4 4192 4207 4222 4236 4251 3265 4279 4292 4306 4319 
15 4332 4345 4357 3370 4282 4394 4406 4418 4430 4441 
16 4452 4463 4474 | 4485 4495 4505 4515 4523 4535 4545 
17 4554 4564 34573 4582 4591 4599 4608 4616 4625 4633 
18 4641 4649 4656 4864 4671 4678 4686 4693 4699 4706 
19 4713 4719 4726 4732 4738 47344 4750 4758 4762 47587 
2.0 4773 47178 4783 4788 4793 4798 4803 3808 4812 4817 
2.1 4821 4826 4830 4834 4838 4842 4846 4850 4854 4857 
22 4861 | 4865 4868 4871 4875 4878 4881 4884 4887 4890 
2.3 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916 
24 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936 
2.5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952 
2.6 4953 4955 4956 4957 4959 4960 4961 4862 4963 4964 
2.7 4965 4966 4967 4968 4969 4970 4971 4972 4973 4974 
2.8 4974 4975 4976 4977 4977 4978 4979 4980 4980 4981 
2.9 4981 4982 4983 4994 4984 4984 4985 4985 4986 4986 
30 4996.5 49897 4987 4988 4988 4988 4989 4989 4989 4990 
3.1 4990.0 4991 4991 4991 4992 4992 4992 4992 4993 4993 
32 4993, 129 
3.3 4995. 166 
3.4 4998.831 
35 4997.674 
3.6 4998.409 
3.2 4998.922 
38 4999.277 
3.9 4999.519 
40 4999.683 
45 4999.968 

4999.997133 
e E 


Fuente: Harold O. Rugg, Statistical Methods Applied to Education, Houghton Mifílin Company, Boston, 
1917, apéndice al anexo Ll, pp. 389-390, con autorización del editor, 


19 09 732533 
37 54 204805 
08 42 26 89 53 
99 0190 25 29 
12 80 7999 70 


66 06 57 47 17 
3106010805 
85 26 97 76 02 
6357332135 
73 79 64 57 53 


98 52017767 
1180 50 54 31 
83 45 29 96 34 
88 68 54 02 00 
99 59 46 7348 


65 48 1176 74 
BO 12 43 56 35 
74 35 09 98 17 
69 91 62 68 03 
09 89 320505 


9149914523 
80 33 69 45 98 
44.10 48 19 49 
125507 37 42 
63 60 64 93 29 


61 19 6904 46 
1547 44 5286 
94 55 728373 
4248116213 
23523783 17 


04 49 35 24 94 
00 54 99 76 54 
3596 31 5307 
59 80 80 8391 
48 05 88 52 36 


33 17900597 
69 23 46 14 06 
19 58 54 14 30 
45 1551 49 38 
94 86 43 1994 


INSTRUCTIVO PARA EL USO DEL VIDEO 


Números aleatorios 


76 £20125 86 
64 89 47 4296 
19 64 50 93 03 
09 376707 15 
80 15 736147 


34 07 27 68 50 
4557 18 24 06 
02 05 16 56 92 
05 32 54 70 48 
03 52 96 47 78 


14 90 56 86 07 
39 80 82 77 32 
06 28 89 80 83 
86 50 7584 01 
87 51 76 49 69 


17 46 85 09 50 
17727080 15 
77402772 14 
66 25 22 91 48 
14 22 56 85 14 


68 47 92 76 86 
26 94 03 68 58 
85 1574 79 54 
11 10 00 20 40 
16 50 53 44 84 


264574 77 74 
95 27 07 99 53 
6789754387 
97 34 408721 
73 20 83 98 37 


75 24 6338 24 
64 05 1881 59 
26 89 80 93 54 
45 42 72 68 42 
01 39 09 22 88 


8737925241 
20 117452 04 
01 758753 79 
19 47 60 72 48 
36 16810851 


JA 67 35 48 7€ 
24 80 52 40 37 
23 20 90 25 60 
38 31 131165 
64 03 2366 53 


36 69 7361 70 
35 30 34 26 14 
68 66 57 48 18 
90 55 35 75 48 
35 80 83 42 82 


22 10 94 05 58 
50 72 56 82 4£ 
13 74 67 00 78 
38 76 66 79 61 
91.82 60 89 28 


58 04 77 69 74 
45 31 82 23 74 
43 23 60 02 10 
36 93 68 72 03 
468 42 75 67 88 


46 16 28 35 54 
70 29 7341 35 
32 97 92 65 75 
12 86 07 46 97 
40 21 95 25 63 


51 92 43 37 29 
59 36 78 38 48 
54 62 24 44 31 
16 86 84 87 67 
68 93 59 14 16 


45 88 25 10 25 
96 11 96 38 96 
33 35 13 54 62 
83 60 94 97 00 
77 28 14 40 7? 


05 56 70 7007 
15 95 68 00 00 
40 41 92 1585 
43 66 79 45 43 
34 88 88 15 53 


80959091 17 
20636104 02 
1595 334764 
88 67 67 4397 
98 95 1168 77 


65 81 3398 85 
86 79 90 74 39 
73 05 383 52 47 
28 46 8287 09 
60 93 52 03 44 


60 97 09 34 33 
29 40 524201 
18 47 54 06 10 
90 35 47 84 93 
93 78 56 13 68 


730395 71 88 
2111578253 
45 52 16 42 37 
76682 113990 
96 29 77 88 22 


94 75 08 99 23 
53 14 03 33 40 
57 60 04 00 81 
96 64 43 94 39 
4365 17 7082 


65 39 4595 93 
82398101 18 
91 1904 25 92 
0307 112059 
26 25 22 96 63 


6196 27 9335 
54 69 28 2391 
7797 45 00 24 
1302 12 4892 
93 91 08 36 47 


88 74317157 
18 74 39 24 23 
66 67 4368 08 
59 04 79 00 33 
01 54 03 54 56 


39 29 27 4945 
00 82 29 1665 
35 08 03 36 06 
04 4362 7659 
1217176833 


1119929170 
23 40 30 97 32 
18 62 38 85 79 
83 49 12 56 24 
35 27 38 84 35 


50 50 07 39 98 
5277587851 
6871177817 
29 80 91 10 62 
23478343 13 


402181 85 44 
14 38 5537 63 
98 28 60 26 55 
94 4005 84 15 
54 38 21 4598 


37 08 92 00 48 
42 05 08 234t 
22 22 20 64 13 
28707258 15 
07 2073 1790 


42 58 2605 27 
3321 1594 68 
92 92 74 59 73 
25 70 1466 70 
06 52 28 25 82 


65 33 71 24 72 
23 28 729529 
90 10 339333 
78 56 52 01 06 
7061742941 


95 39 41 1838 
97 11898338 
84 96 28 52 07 
2082869541 
050145 1176 


Fuente: The Rand Corporation, A Million Random Digits, Free Press, Glencoe, 111, 1955, pp. 1-3, con 
autorización del editor, 
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Distribución de t 


Nivel de significación para la prueba de una sola cola 


Nivel de significación para la prueba de dos colas 


.001 

1 636.619 
2 31.598 
3 12.941 
4 8.510 
5 6.859 
6 5.959 
7 5.405 
8 5.041 
9 4.781 
10 4.587 
11 4.437 
12 4.318 
13 4.221 
14 4,140 
15 4.073 
16 4.015 
17 3.265 
18 3.922 
:19 3.893 
20 3.850 
21 3.819 
22 3.792 
23 3.767 
24 3.745 
25 3.725 
26 3.707 
27 3.690 
28 3.674 
29 3.659 
30 3.646 
40 3.551 
60 3.460 
120 3.373 
mn 3.291 


Fuente: Esuna abreviación del anexo II de Statistical Tables for Biological, Agricultural and Medical Research 
(ed. 1948), de R.A. Fisher y F. Yates, publicada por Oliver £ Boyd, Ltd., Edimburgo y Londres, con la 
autorización de los autores y editores. 


131 


INSTRUCTIVO PARA EL USO DEL VIDEO 


Distribución de X? 
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Valores de F con significancia de 0.05 


2 3 4 3 6 8 12 24 a 


161.4 199.5 215.7 224.6 230.2 234.0 238.9 243.9 249.0 254.3 
18.51 19.00 19.16 19.25 1930 19.33 19.37 19.41 19.45 19.50 


10. 13 9.55 9.28 9.12 9.01 8.94 8.84 8,74 8.64 8.53 
7.71 6.94 6.59 6.39 6.2€ 6.16 6.04 $91 5.77 5.63 
6.61 5.79 5.41 5.19 5.05 4.95 4.82 4.68 4.53 4.36 
5.99 5.14 4.76 4.53 4.39 3.28 4.15 4.00 3.84 3.67 
5.59 4.74 4,35 4.12 3.97 3.87 3.73 3.57 3.41 3.23 
5.32 4.46 4.07 3.84 3.69 3.58 3.44 3.28 3,12 2.93 
5,12 4.26 3,86 3.63 3.48 3.37 3.23 3,07 2.90 2.71 
4,96 4.10 3,71 3.48 3.33 3.22 3.07 3.91 2.74 2.54 
4.84 3.98 3,59 3.36 3.20 3.09 2.95 2.79 2.61 2.40 
4.75 3.88 3.49 3.26 3,11 3.00 2.85 2.69 2.50 2.30 
4.67 3.80 3.41 3.19 3.02 2.92 2.77 2.50 2.42 2.21 
4.60 3.74 3,34 3.11 2.96 2.85 2.70 2.53 2.35 2.13 
4,54 3.68 3,29 3.06 2.90 2.79 2.64 2.48 2.29 2.07 
4.49 3.63 3.24 3.01 2.85 2.74 2.59 2.42 2.24 2.01 
4,45 3.59 3,20 2.96 2.81 2.70 2.55 2.38 2.19 1.96 
4.41 3.55 3.16 2.93 2,77 2.66 2.51 2.34 2.15 192 
4.38 3.52 3.13 2.90 2.74 2.63 2.48 2.31 2.11 1.88 
4.35 3,49 3.10 2.87 2.71 2.60 2.45 2.28 2.08 1.84 
4.32 3.47 3.07 2.84 2.68 2.57 2.42 2.25 2.05 1.81 
4.30 3.44 3.05 2.82 2.66 255 2.40 2.23 2.03 1.78 
4.28 3.42 3.03 2.80 2.64 2.53 2.38 2.20 2.00 1.76 
4.26 3.40 3.01 2.78 2.62 2.51 2.36 2.18 1.98 1.73 
4.24 3.38 2.99 2.76 2.60 2.49 2.34 2.16 1.96 1,71 
4.22 3,37 2.98 2.74 2.59 2.47 2.32 2.15 1.95 1.69 
4.21 3.35 2.96 2.73 2.57 2.46 2.30 2.13 1.93 1.67 
4.20 3.34 2.95 2,71 2.56 2.44 2.29 2.12 1.91 165 
4.18 3.33 2.93 2.70 2.54 2.43 2.28 2.10 1.90 1.64 
4.17 3.32 2.92 2.69 2.53 2.42 2.27 2.09 1.89 1.62 
4.08 3.23 2.84 2.61 2,45 2.34 2.18 2.00 1.79 1.51 
4.00 3,15 2.76 2.52 2.37 2:25 2.10 1.92 1.70 1.39 
3.92 3.07 2 68 2.45 2.29 2.17 2.02 1.83 1.61 1.25 


3.84 2.99 2.60 2.37 2.21 2.09 1.94 1.75 1.52 1.00 
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Valores de F con significancia de 0.01 


Serie 
APRENDER A INVESTIGAR 


ANEXO 


Módulo 4 
Instructivo para el uso del video 


ESTELA URIBE VÉLEZ 


1. Uso didáctico del video 
2. Videos: 


* La medición y las ciencias 
e La curva normal 
e La muestra 
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1. USO DIDÁCTICO DEL VIDEO 


En este documento queremos mostrar la importancia que tiene la utiliza- 
ción de video en las aulas de clase, sus ventajas y desventajas en las activi- 
dades académicas. Así mismo, que es responsabilidad del profesor el buen 
uso que de éste se haga para facilitarle el proceso enseñanza-aprendizaje. 


El video es un sistema de almacenamiento de imágenes y sonidos que 
utiliza los mismos fundamentos técnicos que la televisión y que nació para cu- 
brir las necesidades que las programadoras de T.V. tenían para almacenar sus 
programas y librarse de la esclavitud de la emisión en directo. Su aparición 
revolucionó la tecnología televisiva, que hasta el momento se reducía a la trans- 
misión de sucesos en directo, de forma irrepetible. El video configuró una nueva 
televisión donde el programa elaborado por montaje, el diferido, las repeticio- 
nes y los intercambios de programas, enriquecen la producción televisiva. 


La mayor ventaja que tiene el video con respecto al resto de los audio- 
visuales, desde el punto de vista didáctico, es la posibilidad de una presenta- 
ción flexible y un fed-back inmediato. 


Una de las funciones que debe cumplir el video en el aula es la de ser un 
facilitador para el proceso enseñanza-aprendizaje. 


El docente debe reflexionar sobre la realidad educativa concreta y, como 
consecuencia de ello, descubrir cuáles son sus necesidades reales con rela- 
ción al video como medio concreto, fruto del desarrollo de las nuevas tecno- 
logías de la comunicación y su aplicación en la enseñanza. 


El video como medio didáctico 


La forma más frecuente de esta utilización consiste en el trabajo con el 
grupo/aula —la situación de enseñanza masiva—, en la que el monitor sustituye 
el discurso del profesor. Generalmente se recurre a este medio para motivar/ 
introducir un tema, aunque para algunos temas y/o disciplinas —generalmente 
aquellas centradas en la explicación de procesos, etc.- el video introduce 
algunos momentos didácticos. 


El video puede cumplir diferentes funciones dentro de los procesos de 
enseñanza-aprendizaje; entre ellas tenemos: 


Función motivadora 


El video, como todos los medios basados en lenguajes visuales, es parti- 
cularmente apto para transmitir emociones, sensaciones, afectos, que a me- 
nudo las palabras no logran expresar con la misma precisión, ya que la ima- 
gen, por su misma naturaleza, comunica de manera inmediata, más rápida y 
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emotiva que la palabra. En este sentido, además de implicar al alumno en la 
información videográfica, pueden desarrollarse y afirmarse actitudes, estimu- 
lar la imaginación, la fantasía... 


Básicamente se trata de utilizar el video para captar la atención y, a su 
vez, dar una primera idea, muy general sobre el tema. El tipo de programas 
que podemos emplear puede proceder de emisiones de televisión comercial, 
de películas, de actividades realizadas en el propio centro, entre otras. Su 
grado de elaboración desde el punto de vista educativo puede ser muy ele- 
mental, ya que lo fundamental de esto reside en lo que tiene de actualidad o de 
interés para el alumno. El profesor es quien puede decidir qué tipo de conteni- 
dos son los adecuados, en cada caso concreto, para el desarrollo de esta 
función. El material puede tener los orígenes más diversos. 


Función presentadora/introductoria 


La presentación del contenido del tema, bien en su totalidad, bien en una 
parte del mismo, puede ser otra de las funciones del video en el aula. Esta 
utilización es sensiblemente diferente a la anterior y no se puede entender ni 
tiene sentido de forma aislada. 


El desarrollar un tema en el aula por medio del video debe tener dos accio- 
nes previas: 


1. Adecuar el programa a la situación concreta de clase. 


2. Desarrollar los materiales que van a permitir la comprensión y el desarro- 
llo del mismo, el video por sí solo tiene problemas para, de una forma 
adecuada, dar una información a un grupo de alumnos. La velocidad de la 
narración puede ser, entre otros, uno de los problemas que se pueden 
presentar. Para suplir algunos de estos problemas se hace indispensable 
que el profesor prepare por lo menos dos tipos de materiales complemen- 
tarios a esta presentación como son: 


— Materiales de ampliación del contenido del video. Estos deben permitir 
que el alumno vea la importancia del tema que el video ha mostrado y 
cómo desarrollar aquellos aspectos tratados en el video que puedan 
tener un interés relevante. Deben ser fundamentalmente documentos, 
referencias bibliográficas, etc., que el profesor debe preparar para cada 
video. 


— Materiales de observación o evaluación del video. Deben ser como guías 
de observación del problema, en el que se destacan aquellos aspectos 
del mismo que tienen un mayor interés y que deben ser observados con 
más atención. Tienen una doble función: destacar los puntos fundamen- 
tales y evaluar los contenidos por el alumno. Estas guías contienen una 
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serie de cuestiones que se han de responder con la información que 
facilita el programa visionado. No se trata exclusivamente de preguntas 
y respuestas en el sentido más tradicional. Pueden ser esquemas para 
completar, mapas a complementar, gráficas, etc. 


Un uso complementario de todo lo anterior va a permitir al estudiante no 
sólo la utilización de cualquier guía, sino también la manipulación de los pro- 
gramas de video utilizados en clase, de tal forma que pueda crear con ellos su 
propio programa, bien con intención de completar el aprendizaje o bien con 
una intención evaluadora. 


Función informativa 


Está directamente relacionada con la adquisición de conocimientos y con 
la relación que se establece entre las nuevas informaciones que se reciben y 
las ideas que ya se poseen, desarrollando nuevos conceptos y conocimien- 
tos. El video actúa de mediatizador desde el momento que se trata de una 
observación indirecta. Esta observación no puede limitar el estudio a lo que el 
entorno le ofrece visualmente, sino que se ocupará de cosas que no pueden 
ser observadas directamente, bien por problemas especiales —no se puede 
acceder-, bien por problemas temporales —acontecimientos que pueden apre- 
ciarse con la concentración o dilatación del tiempo-, lugares inaccesibles para 
la visión humana, o por tratarse de una conexión con otras tecnologías —tele- 
scopios, microscopios—, o de acceso difícil, costoso o peligroso. 


Función instructiva 


El video, además de motivar y transmitir información, ha de servir para 
proporcionar instrumentos tendientes a la organización del conocimiento y al 
desarrollo de destrezas. Las destrezas, las actitudes de base conseguidas, 
pueden transferirse a otros ámbitos del conocimiento, de la cultura o de las 
situaciones vitales a través de principios. 


La aplicación de estos principios a la utilización didáctica se centra, fun- 
damentalmente, en la intervención del profesor en la transmisión del mensaje 
—especialmente, en el modo de presentación-, de tal forma que lo haga más 
dinámico y activo. Esta intervención requiere un conocimiento de las im- 
plicaciones que el modo de presentación de un material tiene en el alumno, la 
posibilidad de flexibilizar la utilización de los materiales a fin de adecuarlos al 
mayor abanico de necesidades y condiciones y, por último, requiere también 
la integración del medio en el contexto. 


Estos principios son: 


a. El modo de presentación: La eficacia del mensaje depende tanto del con- 
tenido como de su presentación. 
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b. Flexibilidad de utilización: La flexibilidad supone para el profesor el trata- 
miento de dicho mensaje desde enfoques diversos: 


a. La audiencia: Debe conocer muy bien a su audiencia y tener claras sus 
necesidades. 


b. Contemplar la necesidad de utilización en situaciones didácticas que 
no sean solamente grupales. 


c. Utilización integrada en el contexto educativo: El profesor debe presen- 
tar contenidos que se integren en el medio afectivo, social y cultural del 
alumno destinatario. 


Función de recapitulador 


Este es otro posible uso del video en la situación interactiva de clase, el 
empleo de las secuencias más significativas del tema expuesto, dándole un 
tratamiento diferente, más ágil, más breve, puede permitir que todo el tema se 
resuma en unos pocos minutos, de manera que quede claro cuáles son las 
ideas y los conceptos fundamentales del mismo. 


Las funciones anteriores van interrelacionadas y le corresponde al profe- 
sor desarrollarlas de tal forma que se adecuen a sus propósitos; por lo tanto el 
profesor debe, con anterioridad a la utilización del video en el aula, visionar 
repetidamente el mismo, analizarlo y decidir cuáles son los puntos esenciales 
del tema, desarrollando seguidamente los materiales complementarios para 
los estudiantes. 


El video como medio de expresión y de comunicación 


Si concebimos el video como un medio que une la comunicación didácti- 
ca, es obvio que, además de transmitir información externa "más o menos 
modificada o manipulada por el profesor—, debe servir de medio de expresión 
de las propias ideas y experiencias para los protagonistas del proceso ense- 
ñanza-aprendizaje —profesor y alumnos—. 


El video, por su propia naturaleza, resulta un medio apropiado en una comuni- 
cación bidireccional —multidireccional— en el aula. Su desarrollo como tal, exi- 
ge, no obstante, un cambio radical en algunas concepciones ancladas en el 
sistema educativo y, especialmente, aquellas relacionadas con la facultad y la 
libertad para comunicar. 


Es necesaria la participación libre y consciente por parte del alumno en el 
proceso comunicativo. 
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La simplicidad técnica de manejo y los bajos costos de este medio, hacen 
posible lo que con el cine era más complicado. La enseñanza de la imagen es 
hoy factible en su doble vertiente, para contemplarla y para usarla como me- 
dio de expresión. Conocer los criterios y principios que están detrás de un 
mensaje verboicónico nos permite dos tipos de acciones: 


— Primero. Facilitar la decodificación completa de los programas que nos 
llegan por los medios de comunicación de masas, fundamentalmente la 
televisión. 


— Segundo. Permite utilizar un nuevo medio de expresión de forma correcta, 
de manera que podamos decir lo que deseamos y que nuestro mensaje 
sea decodificado de acuerdo con nuestra intención. 


En relación con esto último debemos recordar que el video es un medio de 
comunicación, y por lo tanto reúne las condiciones necesarias para poder 
establecer por medio de él un proceso de comunicación fundamentalmente 
grupal y en menor medida personal. 


El video como medio de investigación 


El video reúne unas condiciones que le hacen ser un buen auxiliar para la 
investigación, tanto para los estudiosos de la educación, profesores, investi- 
gadores, etc., como para los propios alumnos. Por lo que respecta a los pri- 
meros, el video permite la grabación de distintos tipos de situaciones que 
tengan que ver con la enseñanza y que, posteriormente, se pueda estudiar al 
ritmo que se desee. Reuniones de grupos de trabajo, situaciones de clase, 
entrevistas, etc., son algunas de las ocasiones en las que el video puede 
aportar la posibilidad de observar aspectos que, de otra manera, pueden pa- 
sar inadvertidos. 


En el caso de los alumnos que también es extensible a cualquier tipo de 
investigaciones, el video puede proporcionar el soporte ideal para la observa- 
ción del desarrollo de procesos de tipo físico, etc., archivo documental, reali- 
zación de informes y un buen número más de posibilidades que prácticamen- 
te está limitado solamente por la imaginación y creatividad de los usuarios. 


Otros usos del video 


Evidentemente, existen otros usos del video en el aula, entre los cuales 
podemos destacar su utilización como medio de entretenimiento, o como re- 
cursos para la formación permanente del profesorado, para la comunicación 
universidad-padres, como medio de investigación, entre otros. 


Desde este punto de vista, los usos que resultan básicos para los profe- 
sores pueden ser: 
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En la formación del profesorado, actuando como instrumento de análisis 
en diversas técnicas, como microenseñanza, y también en la familiariza- 
ción de los profesores respecto a dicho medio. 


En la investigación didáctica, como instrumento de análisis de las interac- 
ciones profesor-alumno, de las conductas de los alumnos, de la actuación 
de los profesores... También constituye un campo de investigación en este 
terreno la investigación sobre diseño y elaboración de materiales didácticos 
en video. 


Todos los posibles usos descritos casi nunca podremos aislarlos total- 


mente en la práctica educativa; así por ejemplo, la formación del profesorado 
no puede desligarse del componente de medio de investigación que el video 
desarrolla. 


Ventajas del video como ayuda didáctica 


Permite mostrar situaciones históricas, presentes y futuras. 

Se pueden repetir acciones. 

Se pueden integrar imagen, color y sonido. 

Permite adecuar parte de un tema en imágenes que se puedan proyectar. 
Mantiene la atención del estudiante, si el tema es motivador. 

Posibilita la reflexión en grupo sobre el tema proyectado. 


Se pueden realizar análisis parciales sobre el tema, suspendiendo la pro- 
yección cada vez que el profesor o el estudiante lo consideren necesario. 


Permite la interactividad en clase. 
Puede ser visto en grupos o individualmente. 
No requiere oscuridad para su presentación. 


Desventajas del video como ayuda didáctica 


Sólo se debe presentar una idea del tema que se va a tratar. 
El desarrollo del tema puede ser muy rápido y no se capta fácilmente. 
Si el tema es largo y monótono permite que los estudiantes se distraigan. 


Propicia los comentarios durante la proyección, lo que puede distraer a los 
asistentes. 


Si el tema no está bien tratado permite el adormilamiento entre los asis- 
tentes. 
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Errores más comunes cuando se presenta un video 


No conocer el tema del video con anterioridad a la presentación. 


Desconocer su estado físico (imagen rayada, mal sonido, baches...). 


Pretender que un video por sí solo sea didáctico. 


No preguntar a su audiencia si lo ha visto. 


No hacerle una introducción antes de su presentación. 


No analizar al final de la presentación una evaluación o conclusiones so- 


bre el tema. 


Presentar videos muy largos sin hacer pausas para reflexionar sobre el 
tema o hacer declaraciones sobre el mismo. 


No adecuar el aula para su presentación. 


Apagar la luz cuando se utiliza un monitor de T.V. 


Utilizar un monitor de T.V. pequeño para una audiencia muy grande. 


Desconocer el funcionamiento de los equipos: T.V., VHS o Betamax. 


Algunas recomendaciones para utilizar el video con fines didácticos 


QUÉ NO HACER 


Seleccionar todo el video sólo por 
el título. 


Presentar un video sin conocer su 
contenido y su estado físico, so- 
nido, imagen. 


Proyectar un video sin hacer an- 
tes una presentación del tema. 


Presentar un video sin preguntar 
a los participantes si ya conocen 
su contenido. 


Presentar videos muy largos sin 
hacer una pausa. 


QUÉ HACER 


Ver el contenido del video y analizarlo 
para ver si es apropiado al tema 
que queremos complementar. 


Revisar muy bien el material se- 
leccionado antes de presentarlo. 


Hacer una presentación del tema 
y explicar qué se pretende con el 
video. 


Debemos interrogar a los partici- 
pantes si ya conocen el video, 
para no repetirlo o hacer otro en- 
foque sobre el mismo. 


Hacer una pausa para evitar la fa- 
tiga, hacer preguntas o aclaracio- 
nes sobre el tema si es del caso. 
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6. Presentar videos en idiomas ex- 
tranjeros, 

7. Seleccionar el video como único 
medio de apoyo a un curso. 

8. Utilizar un monitor de T.V. peque- 
ño para audiencias numerosas. 

9. Oscurecer el aula cuando se 
está utilizando un monitor de T.V. 

10. Terminar la presentación sin ha- 
cer conclusiones o preguntas so- 
bre el video. 

Bibliografía 
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Debemos preguntar si el idioma 
del video es comprensible para 
todos. 


Debemos combinar medios en 
nuestros cursos. 


Seleccionar el tamaño del moni- 
tor de T.V. de acuerdo con el nú- 
mero de la audiencia. 


Se debe dejar la luz prendida, 
esto permite observar la reacción 
de la audiencia ante el video. 


. Alterminar de ver un video se de- 


ben hacer preguntas, aclaracio- 
nes, verificar si se cumplió el ob- 
jetivo propuesto. 
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2. VIDEOS 


2.1 VIDEO: «LA MEDICIÓN Y LAS CIENCIAS» 
Introducción 


El propósito de este video es mostrar qué es la medición, sus diferen- 
tes procesos para recolectar la información. 


El material audiovisual cumple la función de complemento o refuerzo al 
material escrito, está concebido como un material autoinstructivo elaborado 
como imágenes sencillas y de una forma coloquial. 


La información consignada en cada uno de los videos es autosuficiente, 
es decir, que en forma independiente comunica una información completa 
sobre un determinado tema. Sin embargo, no debe perder de vista que cada 
uno de ellos es parte integrante de una unidad global que es todo el curso. 


Para complementar el Módulo 4, Análisis de la información, se ha ela- 
borado el video «La medición y las ciencias», el cual le dará una visión pano- 
rámica y al mismo tiempo será un complemento al tema que usted ha estu- 
diado. 


Recomendaciones 


Antes de ver este video le recomendamos haber estudiado el Módulo 4, 
Análisis de la información, y estar familiarizado con las técnicas básicas para 
recolectar la información, 


Recuerde que el ideo es una ayuda complementaria, que pretende refor- 
zar el contenido que usted ya estudio, además debe tener en cuenta: 


+ Para ver el video utilice un monitor de televisión adecuado, mínimo de 14”. 
+ No oscurezca la sala en donde vea el video, así no se fatigará. 
+ Recuerde llevar papel y lápiz para que tome nota. 


+  Esconveniente que sepa manipular el control remoto del VHS o Betamax 
para que pueda adelantar o retroceder en las ideas que no le sean claras. 


+ Después de ver el video debe realizar la Autoevaluación que aparece a 
continuación del guión de contenido. Si ve el video con otros compañeros 
podrá realizar después una mesa redonda para discutir las respuestas, lo 
que lo hará más interesante y así los aportes que hagan los participantes 
serán valiosos. 
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Guión de contenido del video 
«LA MEDICION Y LAS CIENCIAS» 


Los investigadores disponen hoy de instrumentos muy precisos para me- 
dir magnitudes de espacio, de tiempo, de intensidad, no sólo en nuestro mun- 
do cercano sino en el espacio sideral. 


Estos adelantos técnicos son el resultado de un proceso tan largo como la 
presencia humana sobre la Tierra, tan antiguo como su necesidad de enume- 
rar, de contar, de medir las cosas, los animales, los seres diversos que com- 
partían con él su pequeño mundo circundante. Para numerar cosas o para 
medir longitudes, lo más obvio era recurrir al propio cuerpo, utilizar los dedos, 
los brazos, los pies, como unidades de medida; pero al tratarse de longitudes, 
los pies de Pedro eran más largos que los pies de Pablo, y unos y otros más 
largos que los de sus mujeres. Fue preciso entonces escoger arbitrariamente 
el pie derecho de Pedro como medida universal para toda la tribu, y como 
Pedro no podía concurrir a todos los sitios donde se necesita, se hicieron 
réplicas de los pies de Pedro para que todos pudieran utilizarlas. 


La fábula anterior puede ser o no ser una reseña exacta de la manera como 
se inició la historia de las medidas en el mundo, pero fue ésta la manera como 
se impuso, como consecuencia de la revolución francesa, el sistema métrico 
decimal para las mediciones en casi todos los rincones del planeta. Aunque el 
metro de cien centímetros tiene relación matemática como una medida de la 
tierra misma, la medida metro es un objeto de platino e iridio que se encuentra 
en el museo de «Sévres» cerca de París, esa medida tiene la ventaja de que 
se le puede tomar réplicas bastante adecuadas, como ésta que es el patrón 
de longitud para Colombia y reposa en la Universidad Nacional. 


Son medidas arbitrarias en su origen, pero aceptadas por el mundo y por 
consiguiente convertibles para la mayoría de la gente que sabe lo que significa 
un metro, un kilogramo, una hora, un año luz. La investigación científica mo- 
derna se hace en una u otra forma, con base en procesos de medición que 
pretenden señalar las características de los objetos que se investigan; aun- 
que es preciso decir que lo cuantitativo no constituye la parte más importante 
de la investigación y que incluso en investigaciones relativas a ciencias socia- 
les la medición tiene sus limitaciones que deben ser comprendidas por el 
investigador, para que no aspire a llegar con sus conclusiones más allá de lo 
que le permiten los datos. Los procesos de medición se han desarrollado 
más allá en las ciencias naturales y en las llamadas exactas que en las cien- 
cias sociales; pero de todos modos siempre y cuando el investigador tome 
las medidas reservas también el comportamiento de los seres humanos y 
sus actitudes pueden ser medidas, tanto en las ciencias sociales como en las 
naturales o en las exactas. Las mediciones que logramos hacer dejan siem- 
pre margen al error, porque siempre nos valemos de nuestros sentidos que 
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están sujetos permanentemente a insuficiencias habituales o temporales, y 
nuestros instrumentos de medida más perfectos siempre dejan la posibilidad 
abierta para la incertidumbre. Sin embargo, cuando se toman todas las pre- 
cauciones y se realizan todas las pruebas y contra pruebas necesarias, el 
científico puede confiar en sus mediciones y quienes recibimos el beneficio 
de sus investigaciones también podemos aceptar como sólidas las bases 
sobre las que están edificadas. Podemos por ejemplo crear hipótesis sobre 
comportamiento del mercado de algún producto y establecer si dicho com- 
portamiento puede ser observado en sus consecuencias, si luego nuestros 
sentidos y nuestros instrumentos nos dicen que estamos experimentando lo 
que preveíamos, podemos tener confianza en que nuestra hipótesis era cier- 
ta. Lo que sí tiene que considerar indispensable el investigador para que el 
proceso de medición tenga su efecto es la clarificación y clasificación de los 
conceptos que utiliza, de tal manera que haya definiciones que permitan lo- 
grar acuerdos acerca de lo que se trata de expresar, o sea, que los otros 
entiendan lo que quiere decir aunque no lo compartan. 


Hay diversos niveles de medición ya sea en física o en astronomía, en 
sociología o economía, según las propiedades o características que están 
siendo medidas; ante todo el nivel nominal que sólo sirve para clasificar sin 
establecer ninguna otra diferencia entre las unidades o individuos de que se 
trata, y los números vienen a desempeñar medianamente el papel de nom- 
bres para distinguir a uno del otro. El nivel ordinal le asigna valores numéricos 
a los sujetos en tal forma que los valores más altos corresponden a los indivi- 
duos que tiene más de la característica que se está midiendo, con lo que se 
diferencia uno del otro, como en el nivel anterior, pero además introduce la 
posibilidad de un orden determinado. Sin embargo, hay por lo menos dos gran- 
des limitaciones: la diferencia entre el individuo que tiene el número uno y el 
que tiene el número dos no es igual a la que existe entre éste y el que tiene el 
número tres; además, no existe el cero absoluto y si le ponemos el número 
cero a alguno de los muñecos, sería para significar que tiene menor altura que 
el número uno, pero no significaría ausencia de altura. De esas dos fallas, el 
nivel intervalo de medición soluciona la primera, permite establecer el orden 
con intervalos iguales de tal manera que entre 10 y 20 grados hay la misma 
diferencia que entre 20 y 30 grados de temperatura; pero tampoco tenemos el 
cero absoluto, pues una temperatura de cero grados no significa carencia de 
temperatura sino el comienzo de la escala positiva y de la negativa. 


Finalmente existe el nivel de razón o radial en la medición, que incluye las 
posibilidades de los otros niveles, pero también incluye la del cero absoluto. El 
ingreso de las diversas personas se mide en pesos que son iguales para uno 
y para otro; por lo tanto, se pueden diferenciar según reciban más o menos. 
Pero, además, tienen la posibilidad de un cero absoluto como en el caso de 
quien está desempleado y no recibe un solo centavo de ingreso. El investiga- 
dor deberá definir muy bien el nivel de medición que corresponde al problema 
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que desea investigar y el nivel que escoja le estará señalando la técnica esta- 
dística que debe utilizar para analizar los fenómenos. 


Además de la escogencia adecuada de los niveles de medición que el 
investigador necesita, en cada caso debe tener bien claros los factores que 
tomará como constantes y los que tendrá como variables. Generalmente se 
designan los factores constantes con las primeras letras del alfabeto castella- 
no o del griego, y las variables con las últimas letras de nuestro alfabeto, a las 
que se puede añadir distintivos numéricos. Por último, las variables pueden 
tomar sólo cierto número de valores y entonces son variables discretas, como 
cuando damos un valor unitario a cada respuesta acertada de un alumno, o 
pueden ser variables que tomen un número infinito de valores y entonces son 
variables continuas como en el sistema métrico decimal. 


Volvamos sobre la posibilidad de error que siempre acecha al investigador 
y que es más preocupante según sea la necesidad de precisión y el instru- 
mento que utiliza. Los errores pueden obedecer a falla personal, como por 
ejemplo: un defecto de la vista en el investigador, o a defectos sistemáticos 
surgidos de fallas intencionadas o fortuitas de los aparatos de medición. Y 
finalmente se dan los errores aleatorios, que corresponden al mismo proceso 
de medición, ya que por ejemplo: la más precisa de las balanzas no nos da 
siempre la misma medida, aunque es imposible cerrar el paso a toda posibi- 
lidad de error. El científico tiene que cuidar que su investigación sea siempre 
confiable, válida y representativa. 


La calidad interna radica en la representatividad o capacidad de ser gene- 
ralizada que tenga la investigación en los resultados que exhibe. La confiabilidad 
de una medición es la consistencia que muestra al ser realizada varias veces, 
o sea se refiere a la ausencia de errores que aparece en pruebas diferentes. 


La validez de una medición es el grado con que ésta representa una medi- 
da de lo que realmente se quiere medir, o sea de aquello que en etapa anterior 
se ha aclarado conceptualmente como objeto de la investigación o de la me- 
dición específica; con lo que ya se está diciendo que es más importante ase- 
gurarse de la validez de la medición que de su confiabilidad. Aunque no es 
posible establecer directamente la validez de una medición, la práctica cientí- 
fica ha consagrado varias maneras indirectas, ya sea para mediciones he- 
chas en el campo de las ciencias naturales o exactas, o ya sea en el de las 
ciencias sociales. 


Por último la representatividad o generalidad de una medición tiene que 
ver con el grado en que sus resultados surgidos a partir de una muestra pue- 
den ser atribuidos a la población general; porque si la medición no está 
bien hecha pierde representatividad así se haya escogido cuidadosamente la 
muestra. 
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Autoevaluación 
Apoyándose en el contenido del Módulo 4 y del video que acaba de ver, 
conteste o complete si es del caso las siguientes preguntas: 


1. ¿Qué debe considerar el investigador para que el proceso de medi- 
ción tenga efecto? 


¿Cómo pueden ser los niveles de medición? 

¿Para qué sirve el nivel nominal? 

¿Para qué sirve el nivel ordinal? 

¿En qué consiste el nivel de razón o radial en la medición? 


¿Qué determina la técnica estadística que el investigador debe uti- 
lizar para analizar los fenómenos? 


¿Qué otros factores debe considerar el investigador además de la 
escogencia de los niveles de medición? 


¿Cómo pueden ser las variables? 
¿Qué diferencia hay entre estas variables? 


. ¿A qué puede obedecer la posibilidad de error en la medición que 
realiza el investigador? 


. ¿De qué depende la calidad interna de un proceso de investiga- 
ción? 


. ¿En qué radica la calidad externa de los procesos de investigación? 
. ¿En qué consiste la confiabilidad de una medición? 


. ¿Qué es la validez de una medición? 
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Clarificación y clasificación de los conceptos que utiliza, para lograr 
acuerdos acerca de lo que se trata de expresar. 


Nominal, ordinal y el nivel de razón o radial. 


Para clasificar sin establecer ninguna otra diferencia entre las uni- 
dades o individuos de que se trate. 


Asigna valores numéricos y puede introducir la posibilidad de un 
orden determinado. 


Incluye las posibilidades de los otros niveles y la del cero absoluto. 
El nivel de medición. 


Los factores que tomará como constantes y los que tendrá como 
variables. 


Discretas y continuas. 


Las discretas tienen número de valores, las continuas tienen un 
número infinito de valor. 


. + Afalla personal. 


Defectos sistemáticos surgidos de fallas intencionadas o fortui- 
tas de los aparatos de medición. 


Errores aleatorios que corresponden al mismo proceso de medi- 
ción. 


. De la confiabilidad y validez que tenga la observación de los datos. 


. En la representabilidad o capacidad de ser generalizada que tenga 
la investigación en los resultados que exhibe. 


. Es la consistencia que muestra al ser realizada varias veces, o sea 
a la ausencia de error que aparece en pruebas diferentes. 


. Es el grado con que ésta representa una medida de lo que realmen- 
te se quiere medir. 
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2.2 VIDEO: «LA CURVA NORMAL» 


Introducción 


El propósito de este video es mostrar qué es la curva normal, su com- 
prensión y la aplicación en el trabajo investigativo. 


El material audiovisual cumple la función de complemento o refuerzo al 
material escrito, está concebido como un material autoinstructivo elaborado 
con imágenes sencillas y de una forma coloquial. 


La información consignada en cada uno de los videos es autosuficiente, 
es decir, que en forma independiente comunica una información completa 
sobre un determinado tema. Sin embargo, no debe perder de vista que cada 
uno de ellos es parte integrante de una unidad global que es todo el curso. 


Para complementar el Módulo 4. Análisis de la información, se ha ela- 
borado el video «La curva normal», el cual le dará una visión panorámica y al 
mismo tiempo será un complemento al tema que usted ha estudiado. 


Recomendaciones 
Antes de ver este video que tiene una duración de 15 minutos, le recomen- 
damos haber estudiado el Módulo 4, conocer en qué consiste el modelo teóri- 


co de la curva normal y cuáles son sus múltiples aplicaciones. 


Recuerde que el video es una ayuda complementaria, que pretende refor- 
zar el contenido que usted ya estudió; además tenga en cuenta: 


+ Para ver el video utilice un monitor de televisión adecuado, mínimo de 14”. 
+ No oscurezca la sala en donde vea el video, así no se fatigará. 
+ Recuerde llevar papel y lápiz para que tome nota. 


+  Esconveniente que sepa manejar el control remoto del VHS o del Betamax 
para que pueda adelantar o retroceder en las ideas que no le sean claras. 


Después de ver el video debe realizar la Autoevaluación que aparece a 
continuación del guión de contenido. Si ve el video con otros compañeros 
podrá realizar después una mesa redonda para discutir las respuestas, lo que 
lo hará más interesante y así los aportes que hagan los participantes serán 
valiosos. 
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Guión de contenido del video 
«LA CURVA NORMAL» 


¿Qué nuevas vías son necesarias para la ciudad? ¿Qué cantidad de pro- 
visiones debe almacenar este negocio para atender a sus clientes? ¿En qué 
nivel está la calidad de esta deportista? Para responder preguntas como és- 
tas es necesario observar y registrar la frecuencia y la forma como ocurren 
ciertos hechos a lo largo de un período. En el caso de las vías, por ejemplo: 
podríamos llegar a conocer datos como el promedio de vehículos que transi- 
tan durante varios días de la semana; o la clase de vehículos que con más 
frecuencia pasan por allí; son buses, camiones o carros particulares, y con 
mayor observación podríamos llegar a conocer muchos detalles de la forma 
como se comporta el tránsito en esa calle en distintas horas y en diversas 
épocas del año. De la misma manera y con procesos similares de observa- 
ción el propietario de este negocio podría calcular las provisiones que debe 
almacenar de acuerdo con la forma como se comporta la demanda de sus 
clientes según días, horas y clase de producto. 


En el caso del deportista, también sería posible registrar las marcas que 
logra en su deporte, con el fin de medir sus progresos a lo largo de un entrena- 
miento o para compararlo con las marcas que logran otros competidores. La 
estadística nos proporciona entonces un conjunto de técnicas para registrar y 
observar el comportamiento de fenómenos variables. Cuando se efectúan 
mediciones estadísticas se observan diferentes formas en la frecuencia con 
que ocurre el fenómeno. Por ejemplo: si examinas el comportamiento del cliente 
en esta panadería a lo largo del día, es probable encontrar que las ventas 
máximas se localizan en dos períodos, en las primeras horas de la mañana y 
las últimas de la tarde. Esta clase de distribuciones se conocen como bimo- 
dales. En otro tipo de distribuciones las mayores frecuencias se acumulan a 
uno u otro lado de los valores de la variable. Por ejemplo: es probable que las 
calificaciones que un profesor oneroso concede a sus alumnos estén repre- 
sentadas por un tipo de curva concreta en la cual se registra que la mayor 
parte de estudiantes consiguen buenas notas; en el caso del profesor muy 
estricto la distribución de las frecuencias será opuesta al caso anterior. 


En el caso dos, la curva refleja que sólo unos pocos estudiantes consi- 
guen buenas notas, mientras que la mayoría sólo alcanzan calificaciones malas 
o mediocres. Otra clase de distribución, conocida como distribución normal, 
es aquella en la cual las frecuencias tienden a concentrarse uniformemente 
alrededor de un valor central. A esa distribución se aproxima por ejemplo: los 
puntajes que los estudiantes consiguen en exámenes como las pruebas del 
ICFES, o los de ingreso a la universidad; en ese caso la mayor parte de estu- 
diantes se concentra en los puntajes intermedios de la escala, mientras que 
un grupo menor consigue los puntajes máximos y otros resultantes se ubican 
en los mínimos. 
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A partir del concepto de distribución normal, la ciencia de la estadística ha 
desarrollado un modelo teórico de importantes y múltiples aplicaciones. Este 
modelo se conoce como curva normal y no es otra cosa que una representa- 
ción gráfica y matemática de aquellos fenómenos que bajo ciertas condicio- 
nes pueden considerarse como normalmente distribuidos. En su origen la 
curva normal surge como representación de la frecuencia de eventos que 
ocurren al azar, y por lo tanto como parte de la teoría de la probabilidad. En 
efecto, al tomar estas ocho monedas podemos preguntarnos con qué fre- 
cuencia relativa saldrán caras si las lanzáramos un gran número de veces. Lo 
primero que responde la teoría de probabilidad es que en la mayor parte de los 
casos saldrán cuatro caras, del mismo modo podremos suponer que en el 
menor número de veces saldrán solamente caras y que en un número de 
veces igualmente menor no saldrán caras. El histograma completo de fre- 
cuencias relativas para el caso propuesto tendrá finalmente esta distribución, 
y si en vez de ocho lanzáramos dieciséis monedas aumentaría el número de 
las barras dentro del histograma y cada vez se identificaría mejor el perfil de la 
curva y de la distribución normal. De esta manera la curva normal representa 
en su origen la frecuencia con que ocurren fenómenos regidos por el azar, 
sobre los cuales operan multitud de factores independientes. De la misma 
forma que podemos encontrar círculos de diferente diámetro sin que por ello 
pierdan su carácter de círculos, es posible también encontrar curvas cerca- 
nas a la normal, pero con diferentes configuraciones. Por ejemplo: estas dos 
curvas registran el mismo valor como promedio pero su amplitud varía porque 
es distinta a su desviación estándar. 


Estas dos curvas registran promedios diferentes pero sus desviaciones 
estándar son iguales. 


En estas dos curvas los promedios y las desviaciones estándar son dife- 
rentes. 


Sin embargo la familia de las curvas normales cumplen las siguientes 
características: en primer lugar toda curva normal es simétrica, es decir que 
la mitad de su lado izquierdo es igual a la mitad del lado derecho, igualmente 
la distribución que representa la curva normal es unimodal a tal punto que 
promedio, mediana, y moda tienen todos el mismo valor. 


De otra parte, y a diferencia de un polígono de frecuencia, la curva normal 
es continua, y por lo tanto sólo registra en rigor valores de variables que sean 
continuas. 


Otra característica común es que la curva normal es asintótica, es decir, 
que no toca el eje de las «x>» y que por lo tanto ocupará un número infinito de 
observaciones; si bien es cierto que en las ciencias sociales las mediciones 
no son continuas ni el número de observaciones es infinito, la utilidad práctica 
de la curva normal es su valor como modelo estadístico y matemático. 
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La curva normal es un instrumento que ayuda a organizar, describir y pre- 
decir el comportamiento de fenómenos que en su distribución se aproximan a 
la distribución normal. Así por ejemplo, y tomando la curva normal como mo- 
delo, podrían estimarse el porcentaje de colombianos adultos cuya estatura 
varía entre 1.60 metros y 1.80 metros y el porcentaje de aquellos que miden 
menos de 1.60 metros o más de 1.80 metros. 


Otra forma en que la Curva Normal actúa como modelo de suma impor- 
tancia es en la llamada Distribución de Muestreo. En efecto, si obtenemos 
una gran cantidad de muestras aleatorias de un universo dado, el valor de los 
promedios y de otras estadística de esas muestras tienden a conformar una 
distribución normal. A modo de ejemplo veamos este caso: los valores 1, 2 y 
3 conforman nuestro universo. De ese universo vamos a obtener todas las 
posibles muestras de dos elementos. He aquí la primera muestra, el prome- 
dio de esa muestra es uno y lo anotamos en una tabla de frecuencia. Ahora 
vamos a repetir el procedimiento con las otras posibles muestras, es decir, 
tomamos los valores de la muestra y consignamos en la tabla el valor de su 
promedio, he aquí el resultado final, los promedios de las diferentes muestras 
tienen una distribución muy cerca a la normal. Si el universo fuera mayor y las 
muestras más grandes el perfil de la curva normal sería más notable. Hay otro 
hecho en extremo interesante y es que el valor promedio de la distribución de 
estos promedios coinciden con el valor promedio del universo original. Este 
carácter normal de la distribución de muestreo es de gran importancia para 
realizar inferencias ya que permite al investigador calcular la probabilidad de 
que el valor de una estadística obtenida en una muestra, coincida con el valor 
del parámetro de la población o universo. Como modelo teórico, la curva nor- 
mal tiene en síntesis las siguientes características: como sabemos es una 
distribución simétrica y asintótica que no toca el eje horizontal y se extiende 
indefinidamente; el área total debajo de la curva puede representar el número 
total de elementos de la población o universo, es decir, constituye el 100% de 
los casos; esta propiedad permite que entre dos puntajes a lo largo del eje 
horizontal sea posible determinar la proporción de la frecuencia entre dos 
puntajes; proporción que será igual al área de la curva entre esos dos puntos. 
Cuando se normaliza una distribución, el medio aritmético, la mediana y la 
moda son iguales a cero; por lo tanto, los valores al lado izquierdo del eje 
horizontal son negativos mientras que los valores del lado derecho son posi- 
tivos. 


La desviación estándar en una desviación normalizada es igual a uno, el 
68.26% de los valores de la distribución se localizan bajo el área determinada 
por una desviación estándar a cada lado del medio aritmético. Del mismo 
modo el 95.46% de los valores se localizan entre extremos de dos desviacio- 
nes a lado y lado del medio. El 99% de los valores se agrupan bajo el área que 
determinan tres desviaciones estándar a lado y lado del mismo medio. La 
comprensión y aplicación de la curva normal es una exigencia en el trabajo 
investigativo, particularmente cuando se desea hacer inferencias a partir de 
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una muestra. La curva es un modelo, es una abstracción; para aplicarla con 
acierto se requiere su exacta comprensión como instrumento estadístico; lo 
mismo que el conocimiento preciso de la índole y características de la inves- 
tigación para la cual se aplique. 


Autoevaluación 


Apoyándose en el contenido del Módulo 4, y en el video que acaba de ver 
conteste o complete si es del caso las siguientes preguntas: 


¿Qué es la distribución normal? 
¿Qué es la curva normal? 
¿Por qué surge la curva normal? 


¿Cuales son las características que deben cumplir la familia de las 
curvas normales? 


¿Qué es una curva normal asintótica? 
¿Cuál es la utilidad práctica de la curva normal? 


Como modelo estadístico y matemático la curva normal es un ins- 
trumento que ayuda a... 


¿Qué es distribución de muestreo? 


¿Qué características tiene la curva normal como modelo teórico? 


. Cuando se normaliza una distribución, la media aritmética, la me- 
diana y la moda son igual a.... 


. ¿A qué es igual la sesviación estándar de una distribución normali- 
zada? 


12. ¿Qué se necesita para aplicar la curva normal con acierto? 


"opIuajuo9 ap vob ja vos sejsand 
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Es aquella en la cual las frecuencias tienden a concentrarse unifor- 
memente alrededor de un valor central. 


Es una representación gráfica y matemática de aquellos fenóme- 
nos que bajo ciertas condiciones pueden considerarse como nor- 
malmente distribuidos. 


Como representación de la frecuencia de eventos que ocurren al 
azar y por lo tanto como parte de la teoría de la probabilidad. 


Toda curva normal es simétrica. 
La distribución que representa la curva normal es la unimodal. 
La curva normal es continua. 

— La curva normal es asintótica. 


Es la que no toca el eje de la X y por lo tanto ocupará un número 
infinito de observaciones. 


Es su valor como modelo estadístico y matemático. 


Organizar, describir y predecir el comportamiento de fenómenos 


que en su distribución se aproximan a la distribución normal. 


Cuando la curva normal actúa como modelo se obtiene una gran 
cantidad de muestras aleatorias de un universo dado y el valor de 
los promedios y de otras estadísticas tiende a conformar una distri- 
bución de muestreo. 


— Esuna distribución simétrica y asintótica que no toca el eje hori- 
zontal y se extiende independientemente. 


— El área total debajo de la curva normal puede representar el nú- 
mero total de elementos de la población urbana. 


. Cero 
. Auno 


. Su exacta comprensión como instrumento estadístico, lo mismo 
que el conocimiento preciso de la índole y características de la in- 
vestigación para la cual se aplica. 


u0Iden¡easo my e] e seysandsoy 
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2.3 VIDEO: «LA MUESTRA» 


Introducción 


El propósito de este video es mostrar qué es la muestra, cuándo utili- 
zar una muestra, qué obtiene el investigador a través de la muestra. 


El material audiovisual cumple la función de complemento o refuerzo al 
material escrito, está concebido como un material autoinstructivo elaborado 
con imágenes sencillas y de una forma coloquial. 


La información consignada en cada uno de los videos es autosuficiente, 
es decir, que en forma independiente comunica una información completa 
sobre un determinado tema. Sin embargo, no debe perder de vista que cada 
uno de ellos es parte integrante de una unidad global que es todo el curso. 


Para complementar el Módulo 4. Análisis de la información, se ha ela- 
borado el video: «La muestra», el cual le dará una visión panorámica y al 
mismo tiempo será un complemento al tema que usted ha estudiado. 


Recomendaciones 


Antes de ver este video que tiene una duración de 15 minutos, le recomen- 
damos haber estudiado el Módulo 4, conocer qué es la muestra, cómo se 
utiliza, para qué sirve, cómo se determina ésta. Recuerde que el video es una 
ayuda complementaria, que pretende reforzar el contenido que usted ya estu- 
dió. Además tenga en cuenta: 


+ Para ver el video utilice un monitor de televisión adecuado, mínimo de 14”. 
+ No oscurezca la sala en donde vea el video, así no se fatigará. 
+ Recuerde llevar el papel y lápiz para que tome nota. 


+»  Esconveniente que sepa manejar el control remoto del VHS o del Betamax 
para que pueda adelantar o retroceder en las ideas que no le sean claras. 


Después de ver el video debe realizar la Autoevaluación que aparece a 
continuación del guión de contenido. Si ve el video con otros compañeros 
podrá realizar después una mesa redonda para discutir las respuestas, lo que 
lo hará más interesante y así los aportes que hagan los participantes serán 
valiosos. 
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Guión de contenido del video 
«LA MUESTRA» 


Muchas afirmaciones sobre características de las personas de una región 
o sobre las que tienen una misma profesión u oficio, o sobre características 
de las personas según su edad o sexo son ejemplo de generalizaciones, he- 
chas a partir de la observación de apenas unos casos. Eso quiere decir que 
en la vida cotidiana deducimos que una población tiene cierta característica 
por el hecho de haberla observado en una muestra de esa población. 


Todos generalizamos pero todos sabemos que esas generalizaciones no 
son científicamente ciertas; sin embargo, la ciencia también hace generaliza- 
ciones a partir de la observación de un número limitado de casos. La diferen- 
cia está en que la ciencia sigue rigurosos métodos para garantizar la validez 
de sus generalizaciones. En efecto, el trabajo del investigador científico es 
encontrar leyes, relaciones, comportamientos y otras características que per- 
mitan conocer mejor, bien sea el mundo de los fenómenos naturales o bien el 
mundo de los fenómenos humanos y sociales. En este proceso son muchas 
y diversas las preguntas que motivan un trabajo de investigación. Por ejem- 
plo: ¿cuántos desempleados tiene el país? o ¿cómo puede controlarse la roya 
de los cafetos?, o ¿de qué manera influye el nivel educacional de los padres 
en el desarrollo físico y mental de sus hijos? En casos como estos los 
desempleados o los cafetos o los padres de familia constituyen la población o 
universo objeto de cada investigación. Pero ante la imposibilidad de que el 
investigador examine a cada individuo de su universo o población sean desem- 
pleados, o cafetos, o padres de familia o cualquier otro conglomerado, se 
hace indispensable que tan solo observe una muestra tomada de la población 
o universo objeto de su estudio y que a partir de esa muestra pueda generali- 
zar válidamente para todos los casos. Así pues, podemos decir que cuando el 
investigador desea conocer una característica de una población o universo su 
trabajo se orienta en primer lugar a observar esa característica en una mues- 
tra tomada de esa población o universo, los valores que el investigador mide 
en la muestra se conocen como estadística y los valores que corresponden a 
la población o universo se conocen como parámetros. Así por ejemplo puede 
ocurrir que en una muestra encontremos un 10% de desempleo. Ese valor 
sería la estadística, pero es posible que el valor real del desempleo en la ciu- 
dad en la cual se tomó la muestra al contabilizar absolutamente todos los 
casos sea un 12%, esta cifra entonces sería el parámetro. Podemos decir 
entonces que el investigador obtiene estadísticas de la muestra para inferir 
parámetros de la población o universo. En este proceso de inferencia científi- 
ca, el investigador debe cumplir varias y rigurosas exigencias; debe en primer 
lugar garantizar que su muestra sea representativa del universo, es decir, que 
la muestra reproduce las distribuciones y valores del universo o poblaciones 
con márgenes de error calculables. La representatividad de la muestra de- 
pende de varios factores; uno de ellos es la identificación del universo de don- 
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de va a sacar la muestra, esta identificación del universo o marco de muestreo 
no siempre es sencilla; hay algunas dificultades inherentes, la primera es la 
posibilidad de delimitar un universo, por el hecho de que todo universo es un 
organismo vivo que se expande, que crece y es dinámico; tomemos el caso 
de la población de una ciudad o el número de carros que hay en la ciudad, o el 
número de maestros que hay en una nación, esos universos están perma- 
nentemente creciendo y por lo tanto es muy difícil dar una delimitación precisa 
en un momento preciso; en segundo lugar existe una segunda clase de limita- 
ciones que tiene que ver con el tipo de objeto social sobre el cual se va a hacer 
la muestra. 


Hay objetos sociales que de por sí son distintamente definidos como por 
ejemplo: el número de alcohólicos que hay en una ciudad o el número de 
vagabundos, etc., en esos casos evidentemente no hay manera de precisar 
el universo; hay una tercera clase de delimitaciones que tienen que ver con 
las posibilidades tecnológicas al servicio de una investigación, para poder 
delimitar ese universo en objetos que están ya centralizados, que tienen re- 
gistros públicos, por ejemplo el problema no es tanto el dato ni la clase de 
dato, sino el control y la sofisticación que existe en cuanto a la información 
para ese tipo de datos. Otro factor influyente en la representatividad de la 
muestra es el diseño muestral. Diseñar una muestra es buscar que cada 
componente de un universo tenga la posibilidad de estar incluido en la mues- 
tra y que se pueda calcular la posibilidad que cada elemento tenga de estar en 
la muestra. 


Las muestras aleatorias o probabilísticas son de varias clases y exigen 
diferentes procedimientos de selección; sin embargo no son las únicas que 
se utilizan en la investigación porque también existen muestras no proba- 
bilísticas. Las muestras no probabilísticas o intencionales se justifican parti- 
cularmente en etapas exploratorias de la investigación o para finar instrumen- 
tos de redacción de datos o para estudios en profundidad. 


Este es un caso: la muestra no probabilística se elabora siempre sin tener 
en cuenta los procedimientos estadísticos de muestreo, es aquella donde no 
se conoce el universo y es muy difícil, por lo tanto, determinar una muestra, y 
donde los elementos de la muestra tienen no todas las mismas posibilidades 
de ser escogidas para el estudio. Vamos a poner un ejemplo muy claro que es 
la forma de explicarlo. En investigación tenemos una forma de conseguir in- 
formación llamada bola de nieve. La podemos aplicar a una investigación en 
pintura. Por ejemplo: queremos investigar a los pintores en Colombia, única- 
mente conocemos un pintor y no conocemos a los demás, por lo tanto no 
conocemos ni el universo ni la muestra. Vamos donde este pintor que cono- 
cemos y hacemos la entrevista, al final de la entrevista le preguntamos por 
dos pintores similares a él en el grupo que nos interesa. Para hacerle la entre- 
vista vamos donde esta gente, los entrevistamos y al final les preguntamos 
también si conocen otros dos pintores, cada uno de ellos. En esta forma va- 
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mos ampliando el grupo de gente que estamos necesitando y la bola de nieve 
va creciendo. Ya no tenemos solamente uno, tenemos seis y eso se va am- 
pliando. Cada persona nos va dando dos nombres más y en esta forma va- 
mos creando un universo de donde podemos sacar una muestra que la va- 
mos creando. Inicialmente en este caso sería la muestra primero y el universo 
después, pero únicamente debe ser utilizada la muestra no probabilística en 
aquellos casos en que no exista conocimiento sobre el universo y por lo tanto 
la dificultad para conseguir una muestra sea muy grande. 


En resumen el investigador define con la mayor claridad posible el univer- 
so de su estudio, que las amas de casa, que los miembros de partidos políti- 
cos, que los de un servicio público, etc., ahora el investigador obtiene mues- 
tras unas veces aleatorias y otras intencionales de la población o universo 
que desea estudiar, pero ojo, que sean muestras representativas. 


El investigador hace sus observaciones y mediciones sobre la muestra, 
de esa manera obtiene estadísticas o sea valores como frecuencias, prome- 
dios y otros que le sirven para conocer el comportamiento de la muestra de 
las variables que está investigando. Finalmente y mediante procesos estadís- 
ticos el investigador puede, con margen de errores calculables, generalizar a 
la población o universo las observaciones hechas a la muestra; de modo ge- 
neral eso es así; pero hay unos pasos de análisis de datos y comprobación de 
hipótesis muy rigurosos. Medir algo en la muestra y generalizar a la población 
es lo que se conoce como inferencia, es decir, que una estadística nos permi- 
te hallar un parámetro. 


Para definir el tamaño de la muestra hay que considerar algunos aspec- 
tos, unos de orden práctico y otros de orden teórico. En el orden práctico y 
para definir su muestra busca orientaciones en otros estudios similares e 
igualmente examina los recursos económicos con que cuenta, el tiempo de 
que dispone. Desde el punto de vista teórico, el investigador determina su 
muestra principalmente de acuerdo con los objetivos de su estudio e igual- 
mente se sirve de las fórmulas que las estadísticas proporcionan para calcu- 
lar tamaño de muestra. ¿Cómo influyen estos factores prácticos y teóricos 
para que un investigador determine el tamaño de su muestra? 


Un factor importante es la naturaleza del estudio o sea qué tipo de investi- 
gación se está realizando, de qué tipo de investigación se trata. Pongamos 
algunos ejemplos: 


En primer lugar es muy importante la naturaleza del estudio, es decir, qué 
tipo de investigación se está realizando, en qué tipo de disciplina y cuales son 
los objetivos precisos de la investigación para el momento en que el investiga- 
dor selecciona o determina la muestra. En segundo lugar hay dos factores 
también muy importantes, el factor económico y el factor tiempo que ya el 
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investigador debe haber tenido en cuenta desde el momento en que inició su 
investigación. La complejidad de una muestra por ejemplo hace que aumente 
el precio de una investigación o los costos de una investigación. Por otra par- 
te, también se puede racionalizar adecuadamente el tiempo si se han hecho 
estudios previos sobre lo que es la muestra. También debe tenerse en cuenta 
el tipo de procesamiento de la información que se va a hacer, y por otra parte 
la forma como se va a hacer la recolección de información. Una tercera ca- 
racterística importante es la tradición que otros investigadores han construido 
con relación al tipo de muestra que han utilizado, para investigaciones o estu- 
dios similares, finalmente la estadística y la teoría del muestreo han propor- 
cionado herramientas muy valiosas a los investigadores de diferentes discipli- 
nas para la adecuada toma de decisiones, en el momento de determinación 
de la muestra. 


La precisión de los resultados no sólo depende del tamaño de las mues- 
tras, si hay errores de recolección, una muestra grande podría ser mala, mien- 
tas que una muestra pequeña con cuidadosa recolección y selección podría 
ser excelente. 


Una muestra grande no es suficiente para garantizar la precisión de los 
resultados. 


Para determinar una muestra no basta con saber fórmulas matemáticas 
que nos permitan encontrar su tamaño, depende en primer lugar de la preci- 
sión con que esté definido el universo de la investigación, de la claridad que el 
investigador tenga sobre los objetivos y de su estudio, la recolección y proce- 
samiento cuidados de los datos. De esta forma la claridad conceptual y rigor 
metodológico son la garantía necesaria para que finalmente las técnicas esta- 
dísticas permitan inferir resultados a partir de una muestra. 
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Autoevaluación 
Apoyándose en el contenido del Módulo 4, y en el video que acaba de ver 
conteste o complete si es del caso las siguientes preguntas: 
1. ¿Qué es una muestra? 
2. ¿En qué se diferencian las generalizaciones que hace la ciencia 
con respecto a las generalizaciones que no son científicamente 


ciertas? 


¿Cómo se llaman los valores que el investigador mide en la mues- 
tra? 


¿Con qué nombre se conocen los valores que corresponden a la 
población o universo? 


¿De qué depenae la representatividad de la muestra? 

¿Qué es diseñar una muestra? 

¿Qué tipos de muestras se utilizan en la investigación? 

¿Cuándo se utilizan las muestras no probabilísticas o intencionales? 
¿Qué es la muestra no probabilística? 


. El investigador hace sus observaciones y mediciones sobre... 


. ¿Qué obtiene el investigador a través de la muestra? 


. ¿¡Qué es inferencia? 
. ¿Cómo se define el tamaño de la muestra? 


. Para determinar una muestra ¿qué debe tener en cuenta un inves- 
tigador? 


. ¿Qué constituye la garantía necesaria para que finalmente las téc- 
nicas estadísticas permitan resultados a partir de una muestra? 


Son las generalizaciones hechas a partir de la observación de ape- 
nas unos casos. 


En que la ciencia sigue rigurosos métodos para garantizar la vali- 
dez de sus generalizaciones. 


Estadísticos. 
Parámetros. 
De la identificación del universo de donde se va a sacar la muestra. 


Es buscar que cada componente de un universo tenga la posibili- 
dad de estar incluido en la muestra y que se pueda calcular la posi- 
bilidad que cada elemento tenga de estar en la muestra. 


<->Muestras aleatorias o probabilísticas 
<->Muestras no probabilísticas o intencionales 


Se justifican particularmente en etapas exploratorias de la investi- 
gación o para afinar instrumentos de redacción de datos o para es- 
tudios en profundidad. 


Es aquella donde no se conoce el universo y es muy difícil por lo 
tanto determina una muestra y donde los elementos de la muestra 
no tienen todos la misma posibilidad de ser escogidos para el es- 
tudio. 


. La muestra 


. Obtiene estadística, o sea valores como frecuencias, promedios y 
otros que le sirven para conocer el comportamiento de la muestra 
de las variables que está investigando. 


. Es medir algo en la muestra y generalizar a la población. 


. Se debe buscar orientación en otros estudios similares, examinar 
los recursos económicos con que se cuenta, el tiempo de que se 
dispone, lo anterior desde el punto de vista práctico; y desde el pun- 
to de vista teórico el investigador determina su muestra principal- 
mente de acuerdo a los objetivos de su estudio e igualmente se 
sirve de las fórmulas que la estadística proporciona para calcular 
tamaños de muestra. 
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14. — Laprecisión con que esté definido el universo de la investigación. 


— La claridad que el investigador tenga sobre los objetivos y varia- 
bles de su estudio. 


— La recolección y procesamiento cuidadoso de los datos. 


15. La claridad conceptual y rigor metodológico. 
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